144
tutoriales de la biblioteca universidad de jaén vicerrectorado de extensión universitaria

bucear y encontrar en internet

Embed Size (px)

DESCRIPTION

tutorial sobre conceptos basicos de internet

Citation preview

Page 1: bucear y encontrar en internet

tuto

rial

es

de

la b

ibli

ote

ca

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

ldquoir a lo digital caracteriza nuestro fin de siglordquo

Nicholas Negroponte

nunca antes tanta informacioacuten ha sido accesible desde muacuteltiples plataformas

ldquohellipsi nos remontamos a un antildeo tan reciente como 1985 apenas nadie en el mundo habriacutea predicho el alcance mundial de Internet ni habriacutea sido tan audaz para pensar que se convertiriacutea en el motor principal de

desarrollo econoacutemicordquo

Rodney A Brooks Director del Laboratorio de Inteligencia Artificial del MIT

ldquonuevas tecnologiacuteas alteradoras sobreviven con celeridad creciente y cambian fundamentalmente las reglas de los juegos sociales con los que operamos No sienten respeto por tradiciones y praacutecticas y se introducen en nuestras vidas cada vez con mayor insistenciahelliprdquo

nuevos conceptoshellipque nos suenan a todos

bullinfosociedad

bullinfoestructura

bullsociedad informacional

bullsociedad red

bullinterconectividad

bulltecnocultura

bullciberespacio

bullnetcultura

pero tambieacuten hablamos de

exclusioacuten digital

brecha digital

informaacutetica de la dominacioacuten

alfabetizacioacuten informacional

bullAlfabetizacioacuten en herramientas conocimiento y uso de

las herramientas de TI

bullAlfabetizacioacuten en recursos conocimiento de las formas

y meacutetodos de acceso a los recursos informacionales

bullAlfabetizacioacuten socio-estructural comprensioacuten de la

situacioacuten social y de produccioacuten de la informacioacuten

bullAlfabetizacioacuten investigadora uso de TI para la

investigacioacuten y el trabajo acadeacutemico

bullAlfabetizacioacuten en las tecnologiacuteas incipientes

capacidad para comprender las innovaciones en TI y para

tomar decisiones inteligentes

bullAlfabetizacioacuten criacutetica capacidad para evaluar de forma

criacutetica los beneficios y costes de las TI

Shapiro y Hughes

la biblioteca de la Universidad de Jaeacuten

estaacute comprometida con el

concepto de alfabetizacioacuten digital

imprescindible algunos conceptos claveshellip

incluida un poco de

queacute es Internet

bull Un inmenso conjunto de redes de

ordenadores que se encuentran

interconectadas entre siacute dando lugar a la

mayor red de redes de aacutembito mundial

bull Un fenoacutemeno sociocultural de importancia

creciente una nueva forma de entender

las comunicaciones que estaacute transformando el mundo

4 adjetivos

bull grande la mayor red de redes de ordenadores del

mundo (y la que maacutes deprisa crece)

bull cambiante en continua adaptacioacuten a las nuevas

necesidades y circunstancias

bull diversa da cabida a todos los equipos fabricantes

redes tecnologiacuteas y medios fiacutesicos de transmisioacuten

usuarios etc

bull descentralizada no existe una autoridad central es

una ldquounioacuten cooperativardquo en la que cada una de las

miles de redes conectadas conserva su independencia

aunque hay unas normas y procedimientos comunes

que garantizan la intercomunicacioacuten

ldquoEl ciberespaciocualquiera que se conecte ahora tiene que saber que es un universo entero Y cada antildeo

hay maacutes cosas ahiacute dentro

las cosas permanentemente cambianhellip

Internet la tribu planetaria

coacutemo y cuaacutendo

Internet que se originoacute en el aacutembito militar durante

la guerra friacutea se habiacutea desarrollado maacutes allaacute de

los propoacutesitos originales como resultado de su uso

por parte la comunidad cientiacutefica internacional

que necesitaba nuevos sistemas de distribucioacuten

de la informacioacuten

en el principio fue un desarrollo del Departamento de

Defensa USAhellipy estamos en los

antildeos 60

A finales de la deacutecada de los ochenta la

interconexioacuten de miles de redes de aacuterea

local habiacutea convertido Internet en el mayor

almaceacuten de datos que jamaacutes hubiese

existido pero tambieacuten en el maacutes caoacutetico

Raacutepido barato y sin control

el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip

el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip

convertido en el lema de habituales de Internet y que explica el

crecimiento explosivo de la red

FAST CHEAP AND OUT OF CONTROL

coacutemo funciona

La caracteriacutestica primordial de Internet es la de ser

un sistema universal de comunicaciones capaz de

acomodar la maacutes absoluta diversidad

El aglutinante es el conjunto de normas y

lenguajes comunes de comunicacioacuten entre

sistemas conocido como familia de protocolos

TCPIP que permiten la transmisioacuten de datos

Este nombre geneacuterico engloba maacutes de 100

normas o protocolos abiertos que se han

convertido en estaacutendar ldquode factordquo Cada uno da

solucioacuten a un aspecto especiacutefico

Su nombre hace referencia a los dos protocolos

maacutes importantes

-IP (Internet Protocol) transmite los datos de un

lugar a otro de forma fragmentada (en

paquetes)

-TCP (Transmission Control Protocol) asegura

una comunicacioacuten segura y fiable

Entre estos 100 muchos nos son familiares

bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web

bullFTP (File Transfer Protocol) para transferencia de archivos

bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico

bullTELNET para acceder a equipos remotos

la arquitectura de la red

Sigue el modelo cliente-servidor un

paradigma de divisioacuten del trabajo

informaacutetico en el que las tareas se reparten

entre un nuacutemero de clientes que efectuacutean

peticiones de servicios de acuerdo con un

protocolo y un nuacutemero de servidores que

las atienden

explorando Internet

Se ha buscado formas de estructurar el inmenso volumen de

informacioacuten distribuido en miles de nodos de la red

bullGopher servicio de informacioacuten sobre los recursos de

Internet organizado en miles de servidores interconectados

La informacioacuten se presenta clasificada por tipos y accesible

mediante menuacutes jeraacuterquicos

bullWAIS realiza buacutesquedas por contenidos en grandes

documentos textuales o bases de datos

bullWWW (World Wide Web) integra todo lo anterior

novedades conceptuales hipertexto hipermedia

bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para

referirse a un cuerpo de material escrito o graacutefico

interconectado de un modo complejo que no se puede

representar convenientemente sobre el papel puede

contener anotaciones adiciones y notas de los estudiosos

que lo examinanrdquo Era el tiempo del proyecto Xanaduacute

bullLa idea es que el lector examina los nodos de una red y

pasa de unos a otros siguiendo las conexiones (links en

ingleacutes) El hecho de que los nodos pueden contener texto

pero tambieacuten pueden integrar otros medios imagen

sonido etc es lo que se quiere remarcar con otro teacutermino

complementario `hipermedia

El proyecto Xanaduacute de Ted Nelson

cambiariacutea el modo de almacenar

clasificar y pagar la informacioacuten

Habriacutea que esperarhellipXanaduacute no

llegoacute a aplicaciones praacutecticas

Estas nuevas tecnologiacuteas permitiraacuten la idea de

una red de elementos de informacioacuten

libremente accesible alrededor del mundo y

seraacute posible en la World-Wide-Web

Internet como telarantildea

el World-Wide-Web

El proyecto World-Wide-Web del CERN dirigido

por Tim Berners-Lee supone otra vuelta de

tuerca en el intento de poner efectivamente al

alcance de los usuarios el espacio virtual de

conocimiento que es Internet un interface

unificado para el acceso a informacioacuten

distribuida

CERN Organizacioacuten Europea para la Investigacioacuten Nuclear

World-Wide-Web (abreviado `Web escrito

tambieacuten `WWW o incluso `W3) significa algo

asiacute como `red (o telarantildea) global La

propaganda oficial del CERN lo define como

un sistema hipermedia distribuido En

principioacute se pensoacute como un medio para la

distribucioacuten de la informacioacuten entre equipos

de investigadores geograacuteficamente

dispersos concretamente se dirigiacutea a la

comunidad de fiacutesicos de altas energiacuteas

vinculados al CERN

Se pretendiacutea que los recursos disponibles

en formato electroacutenico que residen en

ordenadores distintos conectados a la red

fuesen accesibles para cada investigador

desde su terminal de forma transparente

y exento de dificultades sin necesidad de

aprender a utilizar varios programas

distintos Ademaacutes deberiacutea posibilitarse el

salto entre elementos de informacioacuten

conexos Los recursos existentes

deberiacutean integrarse en una red

hipertextual distribuida gestionada por

ordenadores

Gracias a una diseminacioacuten

relampagueante de tecnologiacuteas y

protocolos el mundo gozoacute de

repente de acceso instantaacuteneo a

cualquier tipo de informacioacuten

Todo esto hace que cambie el

grado de mediacioacuten humana para

obtener acceso a la informacioacuten

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 2: bucear y encontrar en internet

ldquoir a lo digital caracteriza nuestro fin de siglordquo

Nicholas Negroponte

nunca antes tanta informacioacuten ha sido accesible desde muacuteltiples plataformas

ldquohellipsi nos remontamos a un antildeo tan reciente como 1985 apenas nadie en el mundo habriacutea predicho el alcance mundial de Internet ni habriacutea sido tan audaz para pensar que se convertiriacutea en el motor principal de

desarrollo econoacutemicordquo

Rodney A Brooks Director del Laboratorio de Inteligencia Artificial del MIT

ldquonuevas tecnologiacuteas alteradoras sobreviven con celeridad creciente y cambian fundamentalmente las reglas de los juegos sociales con los que operamos No sienten respeto por tradiciones y praacutecticas y se introducen en nuestras vidas cada vez con mayor insistenciahelliprdquo

nuevos conceptoshellipque nos suenan a todos

bullinfosociedad

bullinfoestructura

bullsociedad informacional

bullsociedad red

bullinterconectividad

bulltecnocultura

bullciberespacio

bullnetcultura

pero tambieacuten hablamos de

exclusioacuten digital

brecha digital

informaacutetica de la dominacioacuten

alfabetizacioacuten informacional

bullAlfabetizacioacuten en herramientas conocimiento y uso de

las herramientas de TI

bullAlfabetizacioacuten en recursos conocimiento de las formas

y meacutetodos de acceso a los recursos informacionales

bullAlfabetizacioacuten socio-estructural comprensioacuten de la

situacioacuten social y de produccioacuten de la informacioacuten

bullAlfabetizacioacuten investigadora uso de TI para la

investigacioacuten y el trabajo acadeacutemico

bullAlfabetizacioacuten en las tecnologiacuteas incipientes

capacidad para comprender las innovaciones en TI y para

tomar decisiones inteligentes

bullAlfabetizacioacuten criacutetica capacidad para evaluar de forma

criacutetica los beneficios y costes de las TI

Shapiro y Hughes

la biblioteca de la Universidad de Jaeacuten

estaacute comprometida con el

concepto de alfabetizacioacuten digital

imprescindible algunos conceptos claveshellip

incluida un poco de

queacute es Internet

bull Un inmenso conjunto de redes de

ordenadores que se encuentran

interconectadas entre siacute dando lugar a la

mayor red de redes de aacutembito mundial

bull Un fenoacutemeno sociocultural de importancia

creciente una nueva forma de entender

las comunicaciones que estaacute transformando el mundo

4 adjetivos

bull grande la mayor red de redes de ordenadores del

mundo (y la que maacutes deprisa crece)

bull cambiante en continua adaptacioacuten a las nuevas

necesidades y circunstancias

bull diversa da cabida a todos los equipos fabricantes

redes tecnologiacuteas y medios fiacutesicos de transmisioacuten

usuarios etc

bull descentralizada no existe una autoridad central es

una ldquounioacuten cooperativardquo en la que cada una de las

miles de redes conectadas conserva su independencia

aunque hay unas normas y procedimientos comunes

que garantizan la intercomunicacioacuten

ldquoEl ciberespaciocualquiera que se conecte ahora tiene que saber que es un universo entero Y cada antildeo

hay maacutes cosas ahiacute dentro

las cosas permanentemente cambianhellip

Internet la tribu planetaria

coacutemo y cuaacutendo

Internet que se originoacute en el aacutembito militar durante

la guerra friacutea se habiacutea desarrollado maacutes allaacute de

los propoacutesitos originales como resultado de su uso

por parte la comunidad cientiacutefica internacional

que necesitaba nuevos sistemas de distribucioacuten

de la informacioacuten

en el principio fue un desarrollo del Departamento de

Defensa USAhellipy estamos en los

antildeos 60

A finales de la deacutecada de los ochenta la

interconexioacuten de miles de redes de aacuterea

local habiacutea convertido Internet en el mayor

almaceacuten de datos que jamaacutes hubiese

existido pero tambieacuten en el maacutes caoacutetico

Raacutepido barato y sin control

el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip

el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip

convertido en el lema de habituales de Internet y que explica el

crecimiento explosivo de la red

FAST CHEAP AND OUT OF CONTROL

coacutemo funciona

La caracteriacutestica primordial de Internet es la de ser

un sistema universal de comunicaciones capaz de

acomodar la maacutes absoluta diversidad

El aglutinante es el conjunto de normas y

lenguajes comunes de comunicacioacuten entre

sistemas conocido como familia de protocolos

TCPIP que permiten la transmisioacuten de datos

Este nombre geneacuterico engloba maacutes de 100

normas o protocolos abiertos que se han

convertido en estaacutendar ldquode factordquo Cada uno da

solucioacuten a un aspecto especiacutefico

Su nombre hace referencia a los dos protocolos

maacutes importantes

-IP (Internet Protocol) transmite los datos de un

lugar a otro de forma fragmentada (en

paquetes)

-TCP (Transmission Control Protocol) asegura

una comunicacioacuten segura y fiable

Entre estos 100 muchos nos son familiares

bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web

bullFTP (File Transfer Protocol) para transferencia de archivos

bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico

bullTELNET para acceder a equipos remotos

la arquitectura de la red

Sigue el modelo cliente-servidor un

paradigma de divisioacuten del trabajo

informaacutetico en el que las tareas se reparten

entre un nuacutemero de clientes que efectuacutean

peticiones de servicios de acuerdo con un

protocolo y un nuacutemero de servidores que

las atienden

explorando Internet

Se ha buscado formas de estructurar el inmenso volumen de

informacioacuten distribuido en miles de nodos de la red

bullGopher servicio de informacioacuten sobre los recursos de

Internet organizado en miles de servidores interconectados

La informacioacuten se presenta clasificada por tipos y accesible

mediante menuacutes jeraacuterquicos

bullWAIS realiza buacutesquedas por contenidos en grandes

documentos textuales o bases de datos

bullWWW (World Wide Web) integra todo lo anterior

novedades conceptuales hipertexto hipermedia

bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para

referirse a un cuerpo de material escrito o graacutefico

interconectado de un modo complejo que no se puede

representar convenientemente sobre el papel puede

contener anotaciones adiciones y notas de los estudiosos

que lo examinanrdquo Era el tiempo del proyecto Xanaduacute

bullLa idea es que el lector examina los nodos de una red y

pasa de unos a otros siguiendo las conexiones (links en

ingleacutes) El hecho de que los nodos pueden contener texto

pero tambieacuten pueden integrar otros medios imagen

sonido etc es lo que se quiere remarcar con otro teacutermino

complementario `hipermedia

El proyecto Xanaduacute de Ted Nelson

cambiariacutea el modo de almacenar

clasificar y pagar la informacioacuten

Habriacutea que esperarhellipXanaduacute no

llegoacute a aplicaciones praacutecticas

Estas nuevas tecnologiacuteas permitiraacuten la idea de

una red de elementos de informacioacuten

libremente accesible alrededor del mundo y

seraacute posible en la World-Wide-Web

Internet como telarantildea

el World-Wide-Web

El proyecto World-Wide-Web del CERN dirigido

por Tim Berners-Lee supone otra vuelta de

tuerca en el intento de poner efectivamente al

alcance de los usuarios el espacio virtual de

conocimiento que es Internet un interface

unificado para el acceso a informacioacuten

distribuida

CERN Organizacioacuten Europea para la Investigacioacuten Nuclear

World-Wide-Web (abreviado `Web escrito

tambieacuten `WWW o incluso `W3) significa algo

asiacute como `red (o telarantildea) global La

propaganda oficial del CERN lo define como

un sistema hipermedia distribuido En

principioacute se pensoacute como un medio para la

distribucioacuten de la informacioacuten entre equipos

de investigadores geograacuteficamente

dispersos concretamente se dirigiacutea a la

comunidad de fiacutesicos de altas energiacuteas

vinculados al CERN

Se pretendiacutea que los recursos disponibles

en formato electroacutenico que residen en

ordenadores distintos conectados a la red

fuesen accesibles para cada investigador

desde su terminal de forma transparente

y exento de dificultades sin necesidad de

aprender a utilizar varios programas

distintos Ademaacutes deberiacutea posibilitarse el

salto entre elementos de informacioacuten

conexos Los recursos existentes

deberiacutean integrarse en una red

hipertextual distribuida gestionada por

ordenadores

Gracias a una diseminacioacuten

relampagueante de tecnologiacuteas y

protocolos el mundo gozoacute de

repente de acceso instantaacuteneo a

cualquier tipo de informacioacuten

Todo esto hace que cambie el

grado de mediacioacuten humana para

obtener acceso a la informacioacuten

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 3: bucear y encontrar en internet

ldquohellipsi nos remontamos a un antildeo tan reciente como 1985 apenas nadie en el mundo habriacutea predicho el alcance mundial de Internet ni habriacutea sido tan audaz para pensar que se convertiriacutea en el motor principal de

desarrollo econoacutemicordquo

Rodney A Brooks Director del Laboratorio de Inteligencia Artificial del MIT

ldquonuevas tecnologiacuteas alteradoras sobreviven con celeridad creciente y cambian fundamentalmente las reglas de los juegos sociales con los que operamos No sienten respeto por tradiciones y praacutecticas y se introducen en nuestras vidas cada vez con mayor insistenciahelliprdquo

nuevos conceptoshellipque nos suenan a todos

bullinfosociedad

bullinfoestructura

bullsociedad informacional

bullsociedad red

bullinterconectividad

bulltecnocultura

bullciberespacio

bullnetcultura

pero tambieacuten hablamos de

exclusioacuten digital

brecha digital

informaacutetica de la dominacioacuten

alfabetizacioacuten informacional

bullAlfabetizacioacuten en herramientas conocimiento y uso de

las herramientas de TI

bullAlfabetizacioacuten en recursos conocimiento de las formas

y meacutetodos de acceso a los recursos informacionales

bullAlfabetizacioacuten socio-estructural comprensioacuten de la

situacioacuten social y de produccioacuten de la informacioacuten

bullAlfabetizacioacuten investigadora uso de TI para la

investigacioacuten y el trabajo acadeacutemico

bullAlfabetizacioacuten en las tecnologiacuteas incipientes

capacidad para comprender las innovaciones en TI y para

tomar decisiones inteligentes

bullAlfabetizacioacuten criacutetica capacidad para evaluar de forma

criacutetica los beneficios y costes de las TI

Shapiro y Hughes

la biblioteca de la Universidad de Jaeacuten

estaacute comprometida con el

concepto de alfabetizacioacuten digital

imprescindible algunos conceptos claveshellip

incluida un poco de

queacute es Internet

bull Un inmenso conjunto de redes de

ordenadores que se encuentran

interconectadas entre siacute dando lugar a la

mayor red de redes de aacutembito mundial

bull Un fenoacutemeno sociocultural de importancia

creciente una nueva forma de entender

las comunicaciones que estaacute transformando el mundo

4 adjetivos

bull grande la mayor red de redes de ordenadores del

mundo (y la que maacutes deprisa crece)

bull cambiante en continua adaptacioacuten a las nuevas

necesidades y circunstancias

bull diversa da cabida a todos los equipos fabricantes

redes tecnologiacuteas y medios fiacutesicos de transmisioacuten

usuarios etc

bull descentralizada no existe una autoridad central es

una ldquounioacuten cooperativardquo en la que cada una de las

miles de redes conectadas conserva su independencia

aunque hay unas normas y procedimientos comunes

que garantizan la intercomunicacioacuten

ldquoEl ciberespaciocualquiera que se conecte ahora tiene que saber que es un universo entero Y cada antildeo

hay maacutes cosas ahiacute dentro

las cosas permanentemente cambianhellip

Internet la tribu planetaria

coacutemo y cuaacutendo

Internet que se originoacute en el aacutembito militar durante

la guerra friacutea se habiacutea desarrollado maacutes allaacute de

los propoacutesitos originales como resultado de su uso

por parte la comunidad cientiacutefica internacional

que necesitaba nuevos sistemas de distribucioacuten

de la informacioacuten

en el principio fue un desarrollo del Departamento de

Defensa USAhellipy estamos en los

antildeos 60

A finales de la deacutecada de los ochenta la

interconexioacuten de miles de redes de aacuterea

local habiacutea convertido Internet en el mayor

almaceacuten de datos que jamaacutes hubiese

existido pero tambieacuten en el maacutes caoacutetico

Raacutepido barato y sin control

el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip

el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip

convertido en el lema de habituales de Internet y que explica el

crecimiento explosivo de la red

FAST CHEAP AND OUT OF CONTROL

coacutemo funciona

La caracteriacutestica primordial de Internet es la de ser

un sistema universal de comunicaciones capaz de

acomodar la maacutes absoluta diversidad

El aglutinante es el conjunto de normas y

lenguajes comunes de comunicacioacuten entre

sistemas conocido como familia de protocolos

TCPIP que permiten la transmisioacuten de datos

Este nombre geneacuterico engloba maacutes de 100

normas o protocolos abiertos que se han

convertido en estaacutendar ldquode factordquo Cada uno da

solucioacuten a un aspecto especiacutefico

Su nombre hace referencia a los dos protocolos

maacutes importantes

-IP (Internet Protocol) transmite los datos de un

lugar a otro de forma fragmentada (en

paquetes)

-TCP (Transmission Control Protocol) asegura

una comunicacioacuten segura y fiable

Entre estos 100 muchos nos son familiares

bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web

bullFTP (File Transfer Protocol) para transferencia de archivos

bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico

bullTELNET para acceder a equipos remotos

la arquitectura de la red

Sigue el modelo cliente-servidor un

paradigma de divisioacuten del trabajo

informaacutetico en el que las tareas se reparten

entre un nuacutemero de clientes que efectuacutean

peticiones de servicios de acuerdo con un

protocolo y un nuacutemero de servidores que

las atienden

explorando Internet

Se ha buscado formas de estructurar el inmenso volumen de

informacioacuten distribuido en miles de nodos de la red

bullGopher servicio de informacioacuten sobre los recursos de

Internet organizado en miles de servidores interconectados

La informacioacuten se presenta clasificada por tipos y accesible

mediante menuacutes jeraacuterquicos

bullWAIS realiza buacutesquedas por contenidos en grandes

documentos textuales o bases de datos

bullWWW (World Wide Web) integra todo lo anterior

novedades conceptuales hipertexto hipermedia

bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para

referirse a un cuerpo de material escrito o graacutefico

interconectado de un modo complejo que no se puede

representar convenientemente sobre el papel puede

contener anotaciones adiciones y notas de los estudiosos

que lo examinanrdquo Era el tiempo del proyecto Xanaduacute

bullLa idea es que el lector examina los nodos de una red y

pasa de unos a otros siguiendo las conexiones (links en

ingleacutes) El hecho de que los nodos pueden contener texto

pero tambieacuten pueden integrar otros medios imagen

sonido etc es lo que se quiere remarcar con otro teacutermino

complementario `hipermedia

El proyecto Xanaduacute de Ted Nelson

cambiariacutea el modo de almacenar

clasificar y pagar la informacioacuten

Habriacutea que esperarhellipXanaduacute no

llegoacute a aplicaciones praacutecticas

Estas nuevas tecnologiacuteas permitiraacuten la idea de

una red de elementos de informacioacuten

libremente accesible alrededor del mundo y

seraacute posible en la World-Wide-Web

Internet como telarantildea

el World-Wide-Web

El proyecto World-Wide-Web del CERN dirigido

por Tim Berners-Lee supone otra vuelta de

tuerca en el intento de poner efectivamente al

alcance de los usuarios el espacio virtual de

conocimiento que es Internet un interface

unificado para el acceso a informacioacuten

distribuida

CERN Organizacioacuten Europea para la Investigacioacuten Nuclear

World-Wide-Web (abreviado `Web escrito

tambieacuten `WWW o incluso `W3) significa algo

asiacute como `red (o telarantildea) global La

propaganda oficial del CERN lo define como

un sistema hipermedia distribuido En

principioacute se pensoacute como un medio para la

distribucioacuten de la informacioacuten entre equipos

de investigadores geograacuteficamente

dispersos concretamente se dirigiacutea a la

comunidad de fiacutesicos de altas energiacuteas

vinculados al CERN

Se pretendiacutea que los recursos disponibles

en formato electroacutenico que residen en

ordenadores distintos conectados a la red

fuesen accesibles para cada investigador

desde su terminal de forma transparente

y exento de dificultades sin necesidad de

aprender a utilizar varios programas

distintos Ademaacutes deberiacutea posibilitarse el

salto entre elementos de informacioacuten

conexos Los recursos existentes

deberiacutean integrarse en una red

hipertextual distribuida gestionada por

ordenadores

Gracias a una diseminacioacuten

relampagueante de tecnologiacuteas y

protocolos el mundo gozoacute de

repente de acceso instantaacuteneo a

cualquier tipo de informacioacuten

Todo esto hace que cambie el

grado de mediacioacuten humana para

obtener acceso a la informacioacuten

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 4: bucear y encontrar en internet

nuevos conceptoshellipque nos suenan a todos

bullinfosociedad

bullinfoestructura

bullsociedad informacional

bullsociedad red

bullinterconectividad

bulltecnocultura

bullciberespacio

bullnetcultura

pero tambieacuten hablamos de

exclusioacuten digital

brecha digital

informaacutetica de la dominacioacuten

alfabetizacioacuten informacional

bullAlfabetizacioacuten en herramientas conocimiento y uso de

las herramientas de TI

bullAlfabetizacioacuten en recursos conocimiento de las formas

y meacutetodos de acceso a los recursos informacionales

bullAlfabetizacioacuten socio-estructural comprensioacuten de la

situacioacuten social y de produccioacuten de la informacioacuten

bullAlfabetizacioacuten investigadora uso de TI para la

investigacioacuten y el trabajo acadeacutemico

bullAlfabetizacioacuten en las tecnologiacuteas incipientes

capacidad para comprender las innovaciones en TI y para

tomar decisiones inteligentes

bullAlfabetizacioacuten criacutetica capacidad para evaluar de forma

criacutetica los beneficios y costes de las TI

Shapiro y Hughes

la biblioteca de la Universidad de Jaeacuten

estaacute comprometida con el

concepto de alfabetizacioacuten digital

imprescindible algunos conceptos claveshellip

incluida un poco de

queacute es Internet

bull Un inmenso conjunto de redes de

ordenadores que se encuentran

interconectadas entre siacute dando lugar a la

mayor red de redes de aacutembito mundial

bull Un fenoacutemeno sociocultural de importancia

creciente una nueva forma de entender

las comunicaciones que estaacute transformando el mundo

4 adjetivos

bull grande la mayor red de redes de ordenadores del

mundo (y la que maacutes deprisa crece)

bull cambiante en continua adaptacioacuten a las nuevas

necesidades y circunstancias

bull diversa da cabida a todos los equipos fabricantes

redes tecnologiacuteas y medios fiacutesicos de transmisioacuten

usuarios etc

bull descentralizada no existe una autoridad central es

una ldquounioacuten cooperativardquo en la que cada una de las

miles de redes conectadas conserva su independencia

aunque hay unas normas y procedimientos comunes

que garantizan la intercomunicacioacuten

ldquoEl ciberespaciocualquiera que se conecte ahora tiene que saber que es un universo entero Y cada antildeo

hay maacutes cosas ahiacute dentro

las cosas permanentemente cambianhellip

Internet la tribu planetaria

coacutemo y cuaacutendo

Internet que se originoacute en el aacutembito militar durante

la guerra friacutea se habiacutea desarrollado maacutes allaacute de

los propoacutesitos originales como resultado de su uso

por parte la comunidad cientiacutefica internacional

que necesitaba nuevos sistemas de distribucioacuten

de la informacioacuten

en el principio fue un desarrollo del Departamento de

Defensa USAhellipy estamos en los

antildeos 60

A finales de la deacutecada de los ochenta la

interconexioacuten de miles de redes de aacuterea

local habiacutea convertido Internet en el mayor

almaceacuten de datos que jamaacutes hubiese

existido pero tambieacuten en el maacutes caoacutetico

Raacutepido barato y sin control

el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip

el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip

convertido en el lema de habituales de Internet y que explica el

crecimiento explosivo de la red

FAST CHEAP AND OUT OF CONTROL

coacutemo funciona

La caracteriacutestica primordial de Internet es la de ser

un sistema universal de comunicaciones capaz de

acomodar la maacutes absoluta diversidad

El aglutinante es el conjunto de normas y

lenguajes comunes de comunicacioacuten entre

sistemas conocido como familia de protocolos

TCPIP que permiten la transmisioacuten de datos

Este nombre geneacuterico engloba maacutes de 100

normas o protocolos abiertos que se han

convertido en estaacutendar ldquode factordquo Cada uno da

solucioacuten a un aspecto especiacutefico

Su nombre hace referencia a los dos protocolos

maacutes importantes

-IP (Internet Protocol) transmite los datos de un

lugar a otro de forma fragmentada (en

paquetes)

-TCP (Transmission Control Protocol) asegura

una comunicacioacuten segura y fiable

Entre estos 100 muchos nos son familiares

bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web

bullFTP (File Transfer Protocol) para transferencia de archivos

bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico

bullTELNET para acceder a equipos remotos

la arquitectura de la red

Sigue el modelo cliente-servidor un

paradigma de divisioacuten del trabajo

informaacutetico en el que las tareas se reparten

entre un nuacutemero de clientes que efectuacutean

peticiones de servicios de acuerdo con un

protocolo y un nuacutemero de servidores que

las atienden

explorando Internet

Se ha buscado formas de estructurar el inmenso volumen de

informacioacuten distribuido en miles de nodos de la red

bullGopher servicio de informacioacuten sobre los recursos de

Internet organizado en miles de servidores interconectados

La informacioacuten se presenta clasificada por tipos y accesible

mediante menuacutes jeraacuterquicos

bullWAIS realiza buacutesquedas por contenidos en grandes

documentos textuales o bases de datos

bullWWW (World Wide Web) integra todo lo anterior

novedades conceptuales hipertexto hipermedia

bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para

referirse a un cuerpo de material escrito o graacutefico

interconectado de un modo complejo que no se puede

representar convenientemente sobre el papel puede

contener anotaciones adiciones y notas de los estudiosos

que lo examinanrdquo Era el tiempo del proyecto Xanaduacute

bullLa idea es que el lector examina los nodos de una red y

pasa de unos a otros siguiendo las conexiones (links en

ingleacutes) El hecho de que los nodos pueden contener texto

pero tambieacuten pueden integrar otros medios imagen

sonido etc es lo que se quiere remarcar con otro teacutermino

complementario `hipermedia

El proyecto Xanaduacute de Ted Nelson

cambiariacutea el modo de almacenar

clasificar y pagar la informacioacuten

Habriacutea que esperarhellipXanaduacute no

llegoacute a aplicaciones praacutecticas

Estas nuevas tecnologiacuteas permitiraacuten la idea de

una red de elementos de informacioacuten

libremente accesible alrededor del mundo y

seraacute posible en la World-Wide-Web

Internet como telarantildea

el World-Wide-Web

El proyecto World-Wide-Web del CERN dirigido

por Tim Berners-Lee supone otra vuelta de

tuerca en el intento de poner efectivamente al

alcance de los usuarios el espacio virtual de

conocimiento que es Internet un interface

unificado para el acceso a informacioacuten

distribuida

CERN Organizacioacuten Europea para la Investigacioacuten Nuclear

World-Wide-Web (abreviado `Web escrito

tambieacuten `WWW o incluso `W3) significa algo

asiacute como `red (o telarantildea) global La

propaganda oficial del CERN lo define como

un sistema hipermedia distribuido En

principioacute se pensoacute como un medio para la

distribucioacuten de la informacioacuten entre equipos

de investigadores geograacuteficamente

dispersos concretamente se dirigiacutea a la

comunidad de fiacutesicos de altas energiacuteas

vinculados al CERN

Se pretendiacutea que los recursos disponibles

en formato electroacutenico que residen en

ordenadores distintos conectados a la red

fuesen accesibles para cada investigador

desde su terminal de forma transparente

y exento de dificultades sin necesidad de

aprender a utilizar varios programas

distintos Ademaacutes deberiacutea posibilitarse el

salto entre elementos de informacioacuten

conexos Los recursos existentes

deberiacutean integrarse en una red

hipertextual distribuida gestionada por

ordenadores

Gracias a una diseminacioacuten

relampagueante de tecnologiacuteas y

protocolos el mundo gozoacute de

repente de acceso instantaacuteneo a

cualquier tipo de informacioacuten

Todo esto hace que cambie el

grado de mediacioacuten humana para

obtener acceso a la informacioacuten

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 5: bucear y encontrar en internet

pero tambieacuten hablamos de

exclusioacuten digital

brecha digital

informaacutetica de la dominacioacuten

alfabetizacioacuten informacional

bullAlfabetizacioacuten en herramientas conocimiento y uso de

las herramientas de TI

bullAlfabetizacioacuten en recursos conocimiento de las formas

y meacutetodos de acceso a los recursos informacionales

bullAlfabetizacioacuten socio-estructural comprensioacuten de la

situacioacuten social y de produccioacuten de la informacioacuten

bullAlfabetizacioacuten investigadora uso de TI para la

investigacioacuten y el trabajo acadeacutemico

bullAlfabetizacioacuten en las tecnologiacuteas incipientes

capacidad para comprender las innovaciones en TI y para

tomar decisiones inteligentes

bullAlfabetizacioacuten criacutetica capacidad para evaluar de forma

criacutetica los beneficios y costes de las TI

Shapiro y Hughes

la biblioteca de la Universidad de Jaeacuten

estaacute comprometida con el

concepto de alfabetizacioacuten digital

imprescindible algunos conceptos claveshellip

incluida un poco de

queacute es Internet

bull Un inmenso conjunto de redes de

ordenadores que se encuentran

interconectadas entre siacute dando lugar a la

mayor red de redes de aacutembito mundial

bull Un fenoacutemeno sociocultural de importancia

creciente una nueva forma de entender

las comunicaciones que estaacute transformando el mundo

4 adjetivos

bull grande la mayor red de redes de ordenadores del

mundo (y la que maacutes deprisa crece)

bull cambiante en continua adaptacioacuten a las nuevas

necesidades y circunstancias

bull diversa da cabida a todos los equipos fabricantes

redes tecnologiacuteas y medios fiacutesicos de transmisioacuten

usuarios etc

bull descentralizada no existe una autoridad central es

una ldquounioacuten cooperativardquo en la que cada una de las

miles de redes conectadas conserva su independencia

aunque hay unas normas y procedimientos comunes

que garantizan la intercomunicacioacuten

ldquoEl ciberespaciocualquiera que se conecte ahora tiene que saber que es un universo entero Y cada antildeo

hay maacutes cosas ahiacute dentro

las cosas permanentemente cambianhellip

Internet la tribu planetaria

coacutemo y cuaacutendo

Internet que se originoacute en el aacutembito militar durante

la guerra friacutea se habiacutea desarrollado maacutes allaacute de

los propoacutesitos originales como resultado de su uso

por parte la comunidad cientiacutefica internacional

que necesitaba nuevos sistemas de distribucioacuten

de la informacioacuten

en el principio fue un desarrollo del Departamento de

Defensa USAhellipy estamos en los

antildeos 60

A finales de la deacutecada de los ochenta la

interconexioacuten de miles de redes de aacuterea

local habiacutea convertido Internet en el mayor

almaceacuten de datos que jamaacutes hubiese

existido pero tambieacuten en el maacutes caoacutetico

Raacutepido barato y sin control

el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip

el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip

convertido en el lema de habituales de Internet y que explica el

crecimiento explosivo de la red

FAST CHEAP AND OUT OF CONTROL

coacutemo funciona

La caracteriacutestica primordial de Internet es la de ser

un sistema universal de comunicaciones capaz de

acomodar la maacutes absoluta diversidad

El aglutinante es el conjunto de normas y

lenguajes comunes de comunicacioacuten entre

sistemas conocido como familia de protocolos

TCPIP que permiten la transmisioacuten de datos

Este nombre geneacuterico engloba maacutes de 100

normas o protocolos abiertos que se han

convertido en estaacutendar ldquode factordquo Cada uno da

solucioacuten a un aspecto especiacutefico

Su nombre hace referencia a los dos protocolos

maacutes importantes

-IP (Internet Protocol) transmite los datos de un

lugar a otro de forma fragmentada (en

paquetes)

-TCP (Transmission Control Protocol) asegura

una comunicacioacuten segura y fiable

Entre estos 100 muchos nos son familiares

bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web

bullFTP (File Transfer Protocol) para transferencia de archivos

bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico

bullTELNET para acceder a equipos remotos

la arquitectura de la red

Sigue el modelo cliente-servidor un

paradigma de divisioacuten del trabajo

informaacutetico en el que las tareas se reparten

entre un nuacutemero de clientes que efectuacutean

peticiones de servicios de acuerdo con un

protocolo y un nuacutemero de servidores que

las atienden

explorando Internet

Se ha buscado formas de estructurar el inmenso volumen de

informacioacuten distribuido en miles de nodos de la red

bullGopher servicio de informacioacuten sobre los recursos de

Internet organizado en miles de servidores interconectados

La informacioacuten se presenta clasificada por tipos y accesible

mediante menuacutes jeraacuterquicos

bullWAIS realiza buacutesquedas por contenidos en grandes

documentos textuales o bases de datos

bullWWW (World Wide Web) integra todo lo anterior

novedades conceptuales hipertexto hipermedia

bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para

referirse a un cuerpo de material escrito o graacutefico

interconectado de un modo complejo que no se puede

representar convenientemente sobre el papel puede

contener anotaciones adiciones y notas de los estudiosos

que lo examinanrdquo Era el tiempo del proyecto Xanaduacute

bullLa idea es que el lector examina los nodos de una red y

pasa de unos a otros siguiendo las conexiones (links en

ingleacutes) El hecho de que los nodos pueden contener texto

pero tambieacuten pueden integrar otros medios imagen

sonido etc es lo que se quiere remarcar con otro teacutermino

complementario `hipermedia

El proyecto Xanaduacute de Ted Nelson

cambiariacutea el modo de almacenar

clasificar y pagar la informacioacuten

Habriacutea que esperarhellipXanaduacute no

llegoacute a aplicaciones praacutecticas

Estas nuevas tecnologiacuteas permitiraacuten la idea de

una red de elementos de informacioacuten

libremente accesible alrededor del mundo y

seraacute posible en la World-Wide-Web

Internet como telarantildea

el World-Wide-Web

El proyecto World-Wide-Web del CERN dirigido

por Tim Berners-Lee supone otra vuelta de

tuerca en el intento de poner efectivamente al

alcance de los usuarios el espacio virtual de

conocimiento que es Internet un interface

unificado para el acceso a informacioacuten

distribuida

CERN Organizacioacuten Europea para la Investigacioacuten Nuclear

World-Wide-Web (abreviado `Web escrito

tambieacuten `WWW o incluso `W3) significa algo

asiacute como `red (o telarantildea) global La

propaganda oficial del CERN lo define como

un sistema hipermedia distribuido En

principioacute se pensoacute como un medio para la

distribucioacuten de la informacioacuten entre equipos

de investigadores geograacuteficamente

dispersos concretamente se dirigiacutea a la

comunidad de fiacutesicos de altas energiacuteas

vinculados al CERN

Se pretendiacutea que los recursos disponibles

en formato electroacutenico que residen en

ordenadores distintos conectados a la red

fuesen accesibles para cada investigador

desde su terminal de forma transparente

y exento de dificultades sin necesidad de

aprender a utilizar varios programas

distintos Ademaacutes deberiacutea posibilitarse el

salto entre elementos de informacioacuten

conexos Los recursos existentes

deberiacutean integrarse en una red

hipertextual distribuida gestionada por

ordenadores

Gracias a una diseminacioacuten

relampagueante de tecnologiacuteas y

protocolos el mundo gozoacute de

repente de acceso instantaacuteneo a

cualquier tipo de informacioacuten

Todo esto hace que cambie el

grado de mediacioacuten humana para

obtener acceso a la informacioacuten

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 6: bucear y encontrar en internet

alfabetizacioacuten informacional

bullAlfabetizacioacuten en herramientas conocimiento y uso de

las herramientas de TI

bullAlfabetizacioacuten en recursos conocimiento de las formas

y meacutetodos de acceso a los recursos informacionales

bullAlfabetizacioacuten socio-estructural comprensioacuten de la

situacioacuten social y de produccioacuten de la informacioacuten

bullAlfabetizacioacuten investigadora uso de TI para la

investigacioacuten y el trabajo acadeacutemico

bullAlfabetizacioacuten en las tecnologiacuteas incipientes

capacidad para comprender las innovaciones en TI y para

tomar decisiones inteligentes

bullAlfabetizacioacuten criacutetica capacidad para evaluar de forma

criacutetica los beneficios y costes de las TI

Shapiro y Hughes

la biblioteca de la Universidad de Jaeacuten

estaacute comprometida con el

concepto de alfabetizacioacuten digital

imprescindible algunos conceptos claveshellip

incluida un poco de

queacute es Internet

bull Un inmenso conjunto de redes de

ordenadores que se encuentran

interconectadas entre siacute dando lugar a la

mayor red de redes de aacutembito mundial

bull Un fenoacutemeno sociocultural de importancia

creciente una nueva forma de entender

las comunicaciones que estaacute transformando el mundo

4 adjetivos

bull grande la mayor red de redes de ordenadores del

mundo (y la que maacutes deprisa crece)

bull cambiante en continua adaptacioacuten a las nuevas

necesidades y circunstancias

bull diversa da cabida a todos los equipos fabricantes

redes tecnologiacuteas y medios fiacutesicos de transmisioacuten

usuarios etc

bull descentralizada no existe una autoridad central es

una ldquounioacuten cooperativardquo en la que cada una de las

miles de redes conectadas conserva su independencia

aunque hay unas normas y procedimientos comunes

que garantizan la intercomunicacioacuten

ldquoEl ciberespaciocualquiera que se conecte ahora tiene que saber que es un universo entero Y cada antildeo

hay maacutes cosas ahiacute dentro

las cosas permanentemente cambianhellip

Internet la tribu planetaria

coacutemo y cuaacutendo

Internet que se originoacute en el aacutembito militar durante

la guerra friacutea se habiacutea desarrollado maacutes allaacute de

los propoacutesitos originales como resultado de su uso

por parte la comunidad cientiacutefica internacional

que necesitaba nuevos sistemas de distribucioacuten

de la informacioacuten

en el principio fue un desarrollo del Departamento de

Defensa USAhellipy estamos en los

antildeos 60

A finales de la deacutecada de los ochenta la

interconexioacuten de miles de redes de aacuterea

local habiacutea convertido Internet en el mayor

almaceacuten de datos que jamaacutes hubiese

existido pero tambieacuten en el maacutes caoacutetico

Raacutepido barato y sin control

el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip

el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip

convertido en el lema de habituales de Internet y que explica el

crecimiento explosivo de la red

FAST CHEAP AND OUT OF CONTROL

coacutemo funciona

La caracteriacutestica primordial de Internet es la de ser

un sistema universal de comunicaciones capaz de

acomodar la maacutes absoluta diversidad

El aglutinante es el conjunto de normas y

lenguajes comunes de comunicacioacuten entre

sistemas conocido como familia de protocolos

TCPIP que permiten la transmisioacuten de datos

Este nombre geneacuterico engloba maacutes de 100

normas o protocolos abiertos que se han

convertido en estaacutendar ldquode factordquo Cada uno da

solucioacuten a un aspecto especiacutefico

Su nombre hace referencia a los dos protocolos

maacutes importantes

-IP (Internet Protocol) transmite los datos de un

lugar a otro de forma fragmentada (en

paquetes)

-TCP (Transmission Control Protocol) asegura

una comunicacioacuten segura y fiable

Entre estos 100 muchos nos son familiares

bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web

bullFTP (File Transfer Protocol) para transferencia de archivos

bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico

bullTELNET para acceder a equipos remotos

la arquitectura de la red

Sigue el modelo cliente-servidor un

paradigma de divisioacuten del trabajo

informaacutetico en el que las tareas se reparten

entre un nuacutemero de clientes que efectuacutean

peticiones de servicios de acuerdo con un

protocolo y un nuacutemero de servidores que

las atienden

explorando Internet

Se ha buscado formas de estructurar el inmenso volumen de

informacioacuten distribuido en miles de nodos de la red

bullGopher servicio de informacioacuten sobre los recursos de

Internet organizado en miles de servidores interconectados

La informacioacuten se presenta clasificada por tipos y accesible

mediante menuacutes jeraacuterquicos

bullWAIS realiza buacutesquedas por contenidos en grandes

documentos textuales o bases de datos

bullWWW (World Wide Web) integra todo lo anterior

novedades conceptuales hipertexto hipermedia

bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para

referirse a un cuerpo de material escrito o graacutefico

interconectado de un modo complejo que no se puede

representar convenientemente sobre el papel puede

contener anotaciones adiciones y notas de los estudiosos

que lo examinanrdquo Era el tiempo del proyecto Xanaduacute

bullLa idea es que el lector examina los nodos de una red y

pasa de unos a otros siguiendo las conexiones (links en

ingleacutes) El hecho de que los nodos pueden contener texto

pero tambieacuten pueden integrar otros medios imagen

sonido etc es lo que se quiere remarcar con otro teacutermino

complementario `hipermedia

El proyecto Xanaduacute de Ted Nelson

cambiariacutea el modo de almacenar

clasificar y pagar la informacioacuten

Habriacutea que esperarhellipXanaduacute no

llegoacute a aplicaciones praacutecticas

Estas nuevas tecnologiacuteas permitiraacuten la idea de

una red de elementos de informacioacuten

libremente accesible alrededor del mundo y

seraacute posible en la World-Wide-Web

Internet como telarantildea

el World-Wide-Web

El proyecto World-Wide-Web del CERN dirigido

por Tim Berners-Lee supone otra vuelta de

tuerca en el intento de poner efectivamente al

alcance de los usuarios el espacio virtual de

conocimiento que es Internet un interface

unificado para el acceso a informacioacuten

distribuida

CERN Organizacioacuten Europea para la Investigacioacuten Nuclear

World-Wide-Web (abreviado `Web escrito

tambieacuten `WWW o incluso `W3) significa algo

asiacute como `red (o telarantildea) global La

propaganda oficial del CERN lo define como

un sistema hipermedia distribuido En

principioacute se pensoacute como un medio para la

distribucioacuten de la informacioacuten entre equipos

de investigadores geograacuteficamente

dispersos concretamente se dirigiacutea a la

comunidad de fiacutesicos de altas energiacuteas

vinculados al CERN

Se pretendiacutea que los recursos disponibles

en formato electroacutenico que residen en

ordenadores distintos conectados a la red

fuesen accesibles para cada investigador

desde su terminal de forma transparente

y exento de dificultades sin necesidad de

aprender a utilizar varios programas

distintos Ademaacutes deberiacutea posibilitarse el

salto entre elementos de informacioacuten

conexos Los recursos existentes

deberiacutean integrarse en una red

hipertextual distribuida gestionada por

ordenadores

Gracias a una diseminacioacuten

relampagueante de tecnologiacuteas y

protocolos el mundo gozoacute de

repente de acceso instantaacuteneo a

cualquier tipo de informacioacuten

Todo esto hace que cambie el

grado de mediacioacuten humana para

obtener acceso a la informacioacuten

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 7: bucear y encontrar en internet

bullAlfabetizacioacuten en herramientas conocimiento y uso de

las herramientas de TI

bullAlfabetizacioacuten en recursos conocimiento de las formas

y meacutetodos de acceso a los recursos informacionales

bullAlfabetizacioacuten socio-estructural comprensioacuten de la

situacioacuten social y de produccioacuten de la informacioacuten

bullAlfabetizacioacuten investigadora uso de TI para la

investigacioacuten y el trabajo acadeacutemico

bullAlfabetizacioacuten en las tecnologiacuteas incipientes

capacidad para comprender las innovaciones en TI y para

tomar decisiones inteligentes

bullAlfabetizacioacuten criacutetica capacidad para evaluar de forma

criacutetica los beneficios y costes de las TI

Shapiro y Hughes

la biblioteca de la Universidad de Jaeacuten

estaacute comprometida con el

concepto de alfabetizacioacuten digital

imprescindible algunos conceptos claveshellip

incluida un poco de

queacute es Internet

bull Un inmenso conjunto de redes de

ordenadores que se encuentran

interconectadas entre siacute dando lugar a la

mayor red de redes de aacutembito mundial

bull Un fenoacutemeno sociocultural de importancia

creciente una nueva forma de entender

las comunicaciones que estaacute transformando el mundo

4 adjetivos

bull grande la mayor red de redes de ordenadores del

mundo (y la que maacutes deprisa crece)

bull cambiante en continua adaptacioacuten a las nuevas

necesidades y circunstancias

bull diversa da cabida a todos los equipos fabricantes

redes tecnologiacuteas y medios fiacutesicos de transmisioacuten

usuarios etc

bull descentralizada no existe una autoridad central es

una ldquounioacuten cooperativardquo en la que cada una de las

miles de redes conectadas conserva su independencia

aunque hay unas normas y procedimientos comunes

que garantizan la intercomunicacioacuten

ldquoEl ciberespaciocualquiera que se conecte ahora tiene que saber que es un universo entero Y cada antildeo

hay maacutes cosas ahiacute dentro

las cosas permanentemente cambianhellip

Internet la tribu planetaria

coacutemo y cuaacutendo

Internet que se originoacute en el aacutembito militar durante

la guerra friacutea se habiacutea desarrollado maacutes allaacute de

los propoacutesitos originales como resultado de su uso

por parte la comunidad cientiacutefica internacional

que necesitaba nuevos sistemas de distribucioacuten

de la informacioacuten

en el principio fue un desarrollo del Departamento de

Defensa USAhellipy estamos en los

antildeos 60

A finales de la deacutecada de los ochenta la

interconexioacuten de miles de redes de aacuterea

local habiacutea convertido Internet en el mayor

almaceacuten de datos que jamaacutes hubiese

existido pero tambieacuten en el maacutes caoacutetico

Raacutepido barato y sin control

el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip

el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip

convertido en el lema de habituales de Internet y que explica el

crecimiento explosivo de la red

FAST CHEAP AND OUT OF CONTROL

coacutemo funciona

La caracteriacutestica primordial de Internet es la de ser

un sistema universal de comunicaciones capaz de

acomodar la maacutes absoluta diversidad

El aglutinante es el conjunto de normas y

lenguajes comunes de comunicacioacuten entre

sistemas conocido como familia de protocolos

TCPIP que permiten la transmisioacuten de datos

Este nombre geneacuterico engloba maacutes de 100

normas o protocolos abiertos que se han

convertido en estaacutendar ldquode factordquo Cada uno da

solucioacuten a un aspecto especiacutefico

Su nombre hace referencia a los dos protocolos

maacutes importantes

-IP (Internet Protocol) transmite los datos de un

lugar a otro de forma fragmentada (en

paquetes)

-TCP (Transmission Control Protocol) asegura

una comunicacioacuten segura y fiable

Entre estos 100 muchos nos son familiares

bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web

bullFTP (File Transfer Protocol) para transferencia de archivos

bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico

bullTELNET para acceder a equipos remotos

la arquitectura de la red

Sigue el modelo cliente-servidor un

paradigma de divisioacuten del trabajo

informaacutetico en el que las tareas se reparten

entre un nuacutemero de clientes que efectuacutean

peticiones de servicios de acuerdo con un

protocolo y un nuacutemero de servidores que

las atienden

explorando Internet

Se ha buscado formas de estructurar el inmenso volumen de

informacioacuten distribuido en miles de nodos de la red

bullGopher servicio de informacioacuten sobre los recursos de

Internet organizado en miles de servidores interconectados

La informacioacuten se presenta clasificada por tipos y accesible

mediante menuacutes jeraacuterquicos

bullWAIS realiza buacutesquedas por contenidos en grandes

documentos textuales o bases de datos

bullWWW (World Wide Web) integra todo lo anterior

novedades conceptuales hipertexto hipermedia

bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para

referirse a un cuerpo de material escrito o graacutefico

interconectado de un modo complejo que no se puede

representar convenientemente sobre el papel puede

contener anotaciones adiciones y notas de los estudiosos

que lo examinanrdquo Era el tiempo del proyecto Xanaduacute

bullLa idea es que el lector examina los nodos de una red y

pasa de unos a otros siguiendo las conexiones (links en

ingleacutes) El hecho de que los nodos pueden contener texto

pero tambieacuten pueden integrar otros medios imagen

sonido etc es lo que se quiere remarcar con otro teacutermino

complementario `hipermedia

El proyecto Xanaduacute de Ted Nelson

cambiariacutea el modo de almacenar

clasificar y pagar la informacioacuten

Habriacutea que esperarhellipXanaduacute no

llegoacute a aplicaciones praacutecticas

Estas nuevas tecnologiacuteas permitiraacuten la idea de

una red de elementos de informacioacuten

libremente accesible alrededor del mundo y

seraacute posible en la World-Wide-Web

Internet como telarantildea

el World-Wide-Web

El proyecto World-Wide-Web del CERN dirigido

por Tim Berners-Lee supone otra vuelta de

tuerca en el intento de poner efectivamente al

alcance de los usuarios el espacio virtual de

conocimiento que es Internet un interface

unificado para el acceso a informacioacuten

distribuida

CERN Organizacioacuten Europea para la Investigacioacuten Nuclear

World-Wide-Web (abreviado `Web escrito

tambieacuten `WWW o incluso `W3) significa algo

asiacute como `red (o telarantildea) global La

propaganda oficial del CERN lo define como

un sistema hipermedia distribuido En

principioacute se pensoacute como un medio para la

distribucioacuten de la informacioacuten entre equipos

de investigadores geograacuteficamente

dispersos concretamente se dirigiacutea a la

comunidad de fiacutesicos de altas energiacuteas

vinculados al CERN

Se pretendiacutea que los recursos disponibles

en formato electroacutenico que residen en

ordenadores distintos conectados a la red

fuesen accesibles para cada investigador

desde su terminal de forma transparente

y exento de dificultades sin necesidad de

aprender a utilizar varios programas

distintos Ademaacutes deberiacutea posibilitarse el

salto entre elementos de informacioacuten

conexos Los recursos existentes

deberiacutean integrarse en una red

hipertextual distribuida gestionada por

ordenadores

Gracias a una diseminacioacuten

relampagueante de tecnologiacuteas y

protocolos el mundo gozoacute de

repente de acceso instantaacuteneo a

cualquier tipo de informacioacuten

Todo esto hace que cambie el

grado de mediacioacuten humana para

obtener acceso a la informacioacuten

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 8: bucear y encontrar en internet

la biblioteca de la Universidad de Jaeacuten

estaacute comprometida con el

concepto de alfabetizacioacuten digital

imprescindible algunos conceptos claveshellip

incluida un poco de

queacute es Internet

bull Un inmenso conjunto de redes de

ordenadores que se encuentran

interconectadas entre siacute dando lugar a la

mayor red de redes de aacutembito mundial

bull Un fenoacutemeno sociocultural de importancia

creciente una nueva forma de entender

las comunicaciones que estaacute transformando el mundo

4 adjetivos

bull grande la mayor red de redes de ordenadores del

mundo (y la que maacutes deprisa crece)

bull cambiante en continua adaptacioacuten a las nuevas

necesidades y circunstancias

bull diversa da cabida a todos los equipos fabricantes

redes tecnologiacuteas y medios fiacutesicos de transmisioacuten

usuarios etc

bull descentralizada no existe una autoridad central es

una ldquounioacuten cooperativardquo en la que cada una de las

miles de redes conectadas conserva su independencia

aunque hay unas normas y procedimientos comunes

que garantizan la intercomunicacioacuten

ldquoEl ciberespaciocualquiera que se conecte ahora tiene que saber que es un universo entero Y cada antildeo

hay maacutes cosas ahiacute dentro

las cosas permanentemente cambianhellip

Internet la tribu planetaria

coacutemo y cuaacutendo

Internet que se originoacute en el aacutembito militar durante

la guerra friacutea se habiacutea desarrollado maacutes allaacute de

los propoacutesitos originales como resultado de su uso

por parte la comunidad cientiacutefica internacional

que necesitaba nuevos sistemas de distribucioacuten

de la informacioacuten

en el principio fue un desarrollo del Departamento de

Defensa USAhellipy estamos en los

antildeos 60

A finales de la deacutecada de los ochenta la

interconexioacuten de miles de redes de aacuterea

local habiacutea convertido Internet en el mayor

almaceacuten de datos que jamaacutes hubiese

existido pero tambieacuten en el maacutes caoacutetico

Raacutepido barato y sin control

el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip

el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip

convertido en el lema de habituales de Internet y que explica el

crecimiento explosivo de la red

FAST CHEAP AND OUT OF CONTROL

coacutemo funciona

La caracteriacutestica primordial de Internet es la de ser

un sistema universal de comunicaciones capaz de

acomodar la maacutes absoluta diversidad

El aglutinante es el conjunto de normas y

lenguajes comunes de comunicacioacuten entre

sistemas conocido como familia de protocolos

TCPIP que permiten la transmisioacuten de datos

Este nombre geneacuterico engloba maacutes de 100

normas o protocolos abiertos que se han

convertido en estaacutendar ldquode factordquo Cada uno da

solucioacuten a un aspecto especiacutefico

Su nombre hace referencia a los dos protocolos

maacutes importantes

-IP (Internet Protocol) transmite los datos de un

lugar a otro de forma fragmentada (en

paquetes)

-TCP (Transmission Control Protocol) asegura

una comunicacioacuten segura y fiable

Entre estos 100 muchos nos son familiares

bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web

bullFTP (File Transfer Protocol) para transferencia de archivos

bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico

bullTELNET para acceder a equipos remotos

la arquitectura de la red

Sigue el modelo cliente-servidor un

paradigma de divisioacuten del trabajo

informaacutetico en el que las tareas se reparten

entre un nuacutemero de clientes que efectuacutean

peticiones de servicios de acuerdo con un

protocolo y un nuacutemero de servidores que

las atienden

explorando Internet

Se ha buscado formas de estructurar el inmenso volumen de

informacioacuten distribuido en miles de nodos de la red

bullGopher servicio de informacioacuten sobre los recursos de

Internet organizado en miles de servidores interconectados

La informacioacuten se presenta clasificada por tipos y accesible

mediante menuacutes jeraacuterquicos

bullWAIS realiza buacutesquedas por contenidos en grandes

documentos textuales o bases de datos

bullWWW (World Wide Web) integra todo lo anterior

novedades conceptuales hipertexto hipermedia

bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para

referirse a un cuerpo de material escrito o graacutefico

interconectado de un modo complejo que no se puede

representar convenientemente sobre el papel puede

contener anotaciones adiciones y notas de los estudiosos

que lo examinanrdquo Era el tiempo del proyecto Xanaduacute

bullLa idea es que el lector examina los nodos de una red y

pasa de unos a otros siguiendo las conexiones (links en

ingleacutes) El hecho de que los nodos pueden contener texto

pero tambieacuten pueden integrar otros medios imagen

sonido etc es lo que se quiere remarcar con otro teacutermino

complementario `hipermedia

El proyecto Xanaduacute de Ted Nelson

cambiariacutea el modo de almacenar

clasificar y pagar la informacioacuten

Habriacutea que esperarhellipXanaduacute no

llegoacute a aplicaciones praacutecticas

Estas nuevas tecnologiacuteas permitiraacuten la idea de

una red de elementos de informacioacuten

libremente accesible alrededor del mundo y

seraacute posible en la World-Wide-Web

Internet como telarantildea

el World-Wide-Web

El proyecto World-Wide-Web del CERN dirigido

por Tim Berners-Lee supone otra vuelta de

tuerca en el intento de poner efectivamente al

alcance de los usuarios el espacio virtual de

conocimiento que es Internet un interface

unificado para el acceso a informacioacuten

distribuida

CERN Organizacioacuten Europea para la Investigacioacuten Nuclear

World-Wide-Web (abreviado `Web escrito

tambieacuten `WWW o incluso `W3) significa algo

asiacute como `red (o telarantildea) global La

propaganda oficial del CERN lo define como

un sistema hipermedia distribuido En

principioacute se pensoacute como un medio para la

distribucioacuten de la informacioacuten entre equipos

de investigadores geograacuteficamente

dispersos concretamente se dirigiacutea a la

comunidad de fiacutesicos de altas energiacuteas

vinculados al CERN

Se pretendiacutea que los recursos disponibles

en formato electroacutenico que residen en

ordenadores distintos conectados a la red

fuesen accesibles para cada investigador

desde su terminal de forma transparente

y exento de dificultades sin necesidad de

aprender a utilizar varios programas

distintos Ademaacutes deberiacutea posibilitarse el

salto entre elementos de informacioacuten

conexos Los recursos existentes

deberiacutean integrarse en una red

hipertextual distribuida gestionada por

ordenadores

Gracias a una diseminacioacuten

relampagueante de tecnologiacuteas y

protocolos el mundo gozoacute de

repente de acceso instantaacuteneo a

cualquier tipo de informacioacuten

Todo esto hace que cambie el

grado de mediacioacuten humana para

obtener acceso a la informacioacuten

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 9: bucear y encontrar en internet

imprescindible algunos conceptos claveshellip

incluida un poco de

queacute es Internet

bull Un inmenso conjunto de redes de

ordenadores que se encuentran

interconectadas entre siacute dando lugar a la

mayor red de redes de aacutembito mundial

bull Un fenoacutemeno sociocultural de importancia

creciente una nueva forma de entender

las comunicaciones que estaacute transformando el mundo

4 adjetivos

bull grande la mayor red de redes de ordenadores del

mundo (y la que maacutes deprisa crece)

bull cambiante en continua adaptacioacuten a las nuevas

necesidades y circunstancias

bull diversa da cabida a todos los equipos fabricantes

redes tecnologiacuteas y medios fiacutesicos de transmisioacuten

usuarios etc

bull descentralizada no existe una autoridad central es

una ldquounioacuten cooperativardquo en la que cada una de las

miles de redes conectadas conserva su independencia

aunque hay unas normas y procedimientos comunes

que garantizan la intercomunicacioacuten

ldquoEl ciberespaciocualquiera que se conecte ahora tiene que saber que es un universo entero Y cada antildeo

hay maacutes cosas ahiacute dentro

las cosas permanentemente cambianhellip

Internet la tribu planetaria

coacutemo y cuaacutendo

Internet que se originoacute en el aacutembito militar durante

la guerra friacutea se habiacutea desarrollado maacutes allaacute de

los propoacutesitos originales como resultado de su uso

por parte la comunidad cientiacutefica internacional

que necesitaba nuevos sistemas de distribucioacuten

de la informacioacuten

en el principio fue un desarrollo del Departamento de

Defensa USAhellipy estamos en los

antildeos 60

A finales de la deacutecada de los ochenta la

interconexioacuten de miles de redes de aacuterea

local habiacutea convertido Internet en el mayor

almaceacuten de datos que jamaacutes hubiese

existido pero tambieacuten en el maacutes caoacutetico

Raacutepido barato y sin control

el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip

el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip

convertido en el lema de habituales de Internet y que explica el

crecimiento explosivo de la red

FAST CHEAP AND OUT OF CONTROL

coacutemo funciona

La caracteriacutestica primordial de Internet es la de ser

un sistema universal de comunicaciones capaz de

acomodar la maacutes absoluta diversidad

El aglutinante es el conjunto de normas y

lenguajes comunes de comunicacioacuten entre

sistemas conocido como familia de protocolos

TCPIP que permiten la transmisioacuten de datos

Este nombre geneacuterico engloba maacutes de 100

normas o protocolos abiertos que se han

convertido en estaacutendar ldquode factordquo Cada uno da

solucioacuten a un aspecto especiacutefico

Su nombre hace referencia a los dos protocolos

maacutes importantes

-IP (Internet Protocol) transmite los datos de un

lugar a otro de forma fragmentada (en

paquetes)

-TCP (Transmission Control Protocol) asegura

una comunicacioacuten segura y fiable

Entre estos 100 muchos nos son familiares

bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web

bullFTP (File Transfer Protocol) para transferencia de archivos

bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico

bullTELNET para acceder a equipos remotos

la arquitectura de la red

Sigue el modelo cliente-servidor un

paradigma de divisioacuten del trabajo

informaacutetico en el que las tareas se reparten

entre un nuacutemero de clientes que efectuacutean

peticiones de servicios de acuerdo con un

protocolo y un nuacutemero de servidores que

las atienden

explorando Internet

Se ha buscado formas de estructurar el inmenso volumen de

informacioacuten distribuido en miles de nodos de la red

bullGopher servicio de informacioacuten sobre los recursos de

Internet organizado en miles de servidores interconectados

La informacioacuten se presenta clasificada por tipos y accesible

mediante menuacutes jeraacuterquicos

bullWAIS realiza buacutesquedas por contenidos en grandes

documentos textuales o bases de datos

bullWWW (World Wide Web) integra todo lo anterior

novedades conceptuales hipertexto hipermedia

bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para

referirse a un cuerpo de material escrito o graacutefico

interconectado de un modo complejo que no se puede

representar convenientemente sobre el papel puede

contener anotaciones adiciones y notas de los estudiosos

que lo examinanrdquo Era el tiempo del proyecto Xanaduacute

bullLa idea es que el lector examina los nodos de una red y

pasa de unos a otros siguiendo las conexiones (links en

ingleacutes) El hecho de que los nodos pueden contener texto

pero tambieacuten pueden integrar otros medios imagen

sonido etc es lo que se quiere remarcar con otro teacutermino

complementario `hipermedia

El proyecto Xanaduacute de Ted Nelson

cambiariacutea el modo de almacenar

clasificar y pagar la informacioacuten

Habriacutea que esperarhellipXanaduacute no

llegoacute a aplicaciones praacutecticas

Estas nuevas tecnologiacuteas permitiraacuten la idea de

una red de elementos de informacioacuten

libremente accesible alrededor del mundo y

seraacute posible en la World-Wide-Web

Internet como telarantildea

el World-Wide-Web

El proyecto World-Wide-Web del CERN dirigido

por Tim Berners-Lee supone otra vuelta de

tuerca en el intento de poner efectivamente al

alcance de los usuarios el espacio virtual de

conocimiento que es Internet un interface

unificado para el acceso a informacioacuten

distribuida

CERN Organizacioacuten Europea para la Investigacioacuten Nuclear

World-Wide-Web (abreviado `Web escrito

tambieacuten `WWW o incluso `W3) significa algo

asiacute como `red (o telarantildea) global La

propaganda oficial del CERN lo define como

un sistema hipermedia distribuido En

principioacute se pensoacute como un medio para la

distribucioacuten de la informacioacuten entre equipos

de investigadores geograacuteficamente

dispersos concretamente se dirigiacutea a la

comunidad de fiacutesicos de altas energiacuteas

vinculados al CERN

Se pretendiacutea que los recursos disponibles

en formato electroacutenico que residen en

ordenadores distintos conectados a la red

fuesen accesibles para cada investigador

desde su terminal de forma transparente

y exento de dificultades sin necesidad de

aprender a utilizar varios programas

distintos Ademaacutes deberiacutea posibilitarse el

salto entre elementos de informacioacuten

conexos Los recursos existentes

deberiacutean integrarse en una red

hipertextual distribuida gestionada por

ordenadores

Gracias a una diseminacioacuten

relampagueante de tecnologiacuteas y

protocolos el mundo gozoacute de

repente de acceso instantaacuteneo a

cualquier tipo de informacioacuten

Todo esto hace que cambie el

grado de mediacioacuten humana para

obtener acceso a la informacioacuten

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 10: bucear y encontrar en internet

queacute es Internet

bull Un inmenso conjunto de redes de

ordenadores que se encuentran

interconectadas entre siacute dando lugar a la

mayor red de redes de aacutembito mundial

bull Un fenoacutemeno sociocultural de importancia

creciente una nueva forma de entender

las comunicaciones que estaacute transformando el mundo

4 adjetivos

bull grande la mayor red de redes de ordenadores del

mundo (y la que maacutes deprisa crece)

bull cambiante en continua adaptacioacuten a las nuevas

necesidades y circunstancias

bull diversa da cabida a todos los equipos fabricantes

redes tecnologiacuteas y medios fiacutesicos de transmisioacuten

usuarios etc

bull descentralizada no existe una autoridad central es

una ldquounioacuten cooperativardquo en la que cada una de las

miles de redes conectadas conserva su independencia

aunque hay unas normas y procedimientos comunes

que garantizan la intercomunicacioacuten

ldquoEl ciberespaciocualquiera que se conecte ahora tiene que saber que es un universo entero Y cada antildeo

hay maacutes cosas ahiacute dentro

las cosas permanentemente cambianhellip

Internet la tribu planetaria

coacutemo y cuaacutendo

Internet que se originoacute en el aacutembito militar durante

la guerra friacutea se habiacutea desarrollado maacutes allaacute de

los propoacutesitos originales como resultado de su uso

por parte la comunidad cientiacutefica internacional

que necesitaba nuevos sistemas de distribucioacuten

de la informacioacuten

en el principio fue un desarrollo del Departamento de

Defensa USAhellipy estamos en los

antildeos 60

A finales de la deacutecada de los ochenta la

interconexioacuten de miles de redes de aacuterea

local habiacutea convertido Internet en el mayor

almaceacuten de datos que jamaacutes hubiese

existido pero tambieacuten en el maacutes caoacutetico

Raacutepido barato y sin control

el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip

el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip

convertido en el lema de habituales de Internet y que explica el

crecimiento explosivo de la red

FAST CHEAP AND OUT OF CONTROL

coacutemo funciona

La caracteriacutestica primordial de Internet es la de ser

un sistema universal de comunicaciones capaz de

acomodar la maacutes absoluta diversidad

El aglutinante es el conjunto de normas y

lenguajes comunes de comunicacioacuten entre

sistemas conocido como familia de protocolos

TCPIP que permiten la transmisioacuten de datos

Este nombre geneacuterico engloba maacutes de 100

normas o protocolos abiertos que se han

convertido en estaacutendar ldquode factordquo Cada uno da

solucioacuten a un aspecto especiacutefico

Su nombre hace referencia a los dos protocolos

maacutes importantes

-IP (Internet Protocol) transmite los datos de un

lugar a otro de forma fragmentada (en

paquetes)

-TCP (Transmission Control Protocol) asegura

una comunicacioacuten segura y fiable

Entre estos 100 muchos nos son familiares

bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web

bullFTP (File Transfer Protocol) para transferencia de archivos

bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico

bullTELNET para acceder a equipos remotos

la arquitectura de la red

Sigue el modelo cliente-servidor un

paradigma de divisioacuten del trabajo

informaacutetico en el que las tareas se reparten

entre un nuacutemero de clientes que efectuacutean

peticiones de servicios de acuerdo con un

protocolo y un nuacutemero de servidores que

las atienden

explorando Internet

Se ha buscado formas de estructurar el inmenso volumen de

informacioacuten distribuido en miles de nodos de la red

bullGopher servicio de informacioacuten sobre los recursos de

Internet organizado en miles de servidores interconectados

La informacioacuten se presenta clasificada por tipos y accesible

mediante menuacutes jeraacuterquicos

bullWAIS realiza buacutesquedas por contenidos en grandes

documentos textuales o bases de datos

bullWWW (World Wide Web) integra todo lo anterior

novedades conceptuales hipertexto hipermedia

bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para

referirse a un cuerpo de material escrito o graacutefico

interconectado de un modo complejo que no se puede

representar convenientemente sobre el papel puede

contener anotaciones adiciones y notas de los estudiosos

que lo examinanrdquo Era el tiempo del proyecto Xanaduacute

bullLa idea es que el lector examina los nodos de una red y

pasa de unos a otros siguiendo las conexiones (links en

ingleacutes) El hecho de que los nodos pueden contener texto

pero tambieacuten pueden integrar otros medios imagen

sonido etc es lo que se quiere remarcar con otro teacutermino

complementario `hipermedia

El proyecto Xanaduacute de Ted Nelson

cambiariacutea el modo de almacenar

clasificar y pagar la informacioacuten

Habriacutea que esperarhellipXanaduacute no

llegoacute a aplicaciones praacutecticas

Estas nuevas tecnologiacuteas permitiraacuten la idea de

una red de elementos de informacioacuten

libremente accesible alrededor del mundo y

seraacute posible en la World-Wide-Web

Internet como telarantildea

el World-Wide-Web

El proyecto World-Wide-Web del CERN dirigido

por Tim Berners-Lee supone otra vuelta de

tuerca en el intento de poner efectivamente al

alcance de los usuarios el espacio virtual de

conocimiento que es Internet un interface

unificado para el acceso a informacioacuten

distribuida

CERN Organizacioacuten Europea para la Investigacioacuten Nuclear

World-Wide-Web (abreviado `Web escrito

tambieacuten `WWW o incluso `W3) significa algo

asiacute como `red (o telarantildea) global La

propaganda oficial del CERN lo define como

un sistema hipermedia distribuido En

principioacute se pensoacute como un medio para la

distribucioacuten de la informacioacuten entre equipos

de investigadores geograacuteficamente

dispersos concretamente se dirigiacutea a la

comunidad de fiacutesicos de altas energiacuteas

vinculados al CERN

Se pretendiacutea que los recursos disponibles

en formato electroacutenico que residen en

ordenadores distintos conectados a la red

fuesen accesibles para cada investigador

desde su terminal de forma transparente

y exento de dificultades sin necesidad de

aprender a utilizar varios programas

distintos Ademaacutes deberiacutea posibilitarse el

salto entre elementos de informacioacuten

conexos Los recursos existentes

deberiacutean integrarse en una red

hipertextual distribuida gestionada por

ordenadores

Gracias a una diseminacioacuten

relampagueante de tecnologiacuteas y

protocolos el mundo gozoacute de

repente de acceso instantaacuteneo a

cualquier tipo de informacioacuten

Todo esto hace que cambie el

grado de mediacioacuten humana para

obtener acceso a la informacioacuten

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 11: bucear y encontrar en internet

4 adjetivos

bull grande la mayor red de redes de ordenadores del

mundo (y la que maacutes deprisa crece)

bull cambiante en continua adaptacioacuten a las nuevas

necesidades y circunstancias

bull diversa da cabida a todos los equipos fabricantes

redes tecnologiacuteas y medios fiacutesicos de transmisioacuten

usuarios etc

bull descentralizada no existe una autoridad central es

una ldquounioacuten cooperativardquo en la que cada una de las

miles de redes conectadas conserva su independencia

aunque hay unas normas y procedimientos comunes

que garantizan la intercomunicacioacuten

ldquoEl ciberespaciocualquiera que se conecte ahora tiene que saber que es un universo entero Y cada antildeo

hay maacutes cosas ahiacute dentro

las cosas permanentemente cambianhellip

Internet la tribu planetaria

coacutemo y cuaacutendo

Internet que se originoacute en el aacutembito militar durante

la guerra friacutea se habiacutea desarrollado maacutes allaacute de

los propoacutesitos originales como resultado de su uso

por parte la comunidad cientiacutefica internacional

que necesitaba nuevos sistemas de distribucioacuten

de la informacioacuten

en el principio fue un desarrollo del Departamento de

Defensa USAhellipy estamos en los

antildeos 60

A finales de la deacutecada de los ochenta la

interconexioacuten de miles de redes de aacuterea

local habiacutea convertido Internet en el mayor

almaceacuten de datos que jamaacutes hubiese

existido pero tambieacuten en el maacutes caoacutetico

Raacutepido barato y sin control

el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip

el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip

convertido en el lema de habituales de Internet y que explica el

crecimiento explosivo de la red

FAST CHEAP AND OUT OF CONTROL

coacutemo funciona

La caracteriacutestica primordial de Internet es la de ser

un sistema universal de comunicaciones capaz de

acomodar la maacutes absoluta diversidad

El aglutinante es el conjunto de normas y

lenguajes comunes de comunicacioacuten entre

sistemas conocido como familia de protocolos

TCPIP que permiten la transmisioacuten de datos

Este nombre geneacuterico engloba maacutes de 100

normas o protocolos abiertos que se han

convertido en estaacutendar ldquode factordquo Cada uno da

solucioacuten a un aspecto especiacutefico

Su nombre hace referencia a los dos protocolos

maacutes importantes

-IP (Internet Protocol) transmite los datos de un

lugar a otro de forma fragmentada (en

paquetes)

-TCP (Transmission Control Protocol) asegura

una comunicacioacuten segura y fiable

Entre estos 100 muchos nos son familiares

bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web

bullFTP (File Transfer Protocol) para transferencia de archivos

bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico

bullTELNET para acceder a equipos remotos

la arquitectura de la red

Sigue el modelo cliente-servidor un

paradigma de divisioacuten del trabajo

informaacutetico en el que las tareas se reparten

entre un nuacutemero de clientes que efectuacutean

peticiones de servicios de acuerdo con un

protocolo y un nuacutemero de servidores que

las atienden

explorando Internet

Se ha buscado formas de estructurar el inmenso volumen de

informacioacuten distribuido en miles de nodos de la red

bullGopher servicio de informacioacuten sobre los recursos de

Internet organizado en miles de servidores interconectados

La informacioacuten se presenta clasificada por tipos y accesible

mediante menuacutes jeraacuterquicos

bullWAIS realiza buacutesquedas por contenidos en grandes

documentos textuales o bases de datos

bullWWW (World Wide Web) integra todo lo anterior

novedades conceptuales hipertexto hipermedia

bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para

referirse a un cuerpo de material escrito o graacutefico

interconectado de un modo complejo que no se puede

representar convenientemente sobre el papel puede

contener anotaciones adiciones y notas de los estudiosos

que lo examinanrdquo Era el tiempo del proyecto Xanaduacute

bullLa idea es que el lector examina los nodos de una red y

pasa de unos a otros siguiendo las conexiones (links en

ingleacutes) El hecho de que los nodos pueden contener texto

pero tambieacuten pueden integrar otros medios imagen

sonido etc es lo que se quiere remarcar con otro teacutermino

complementario `hipermedia

El proyecto Xanaduacute de Ted Nelson

cambiariacutea el modo de almacenar

clasificar y pagar la informacioacuten

Habriacutea que esperarhellipXanaduacute no

llegoacute a aplicaciones praacutecticas

Estas nuevas tecnologiacuteas permitiraacuten la idea de

una red de elementos de informacioacuten

libremente accesible alrededor del mundo y

seraacute posible en la World-Wide-Web

Internet como telarantildea

el World-Wide-Web

El proyecto World-Wide-Web del CERN dirigido

por Tim Berners-Lee supone otra vuelta de

tuerca en el intento de poner efectivamente al

alcance de los usuarios el espacio virtual de

conocimiento que es Internet un interface

unificado para el acceso a informacioacuten

distribuida

CERN Organizacioacuten Europea para la Investigacioacuten Nuclear

World-Wide-Web (abreviado `Web escrito

tambieacuten `WWW o incluso `W3) significa algo

asiacute como `red (o telarantildea) global La

propaganda oficial del CERN lo define como

un sistema hipermedia distribuido En

principioacute se pensoacute como un medio para la

distribucioacuten de la informacioacuten entre equipos

de investigadores geograacuteficamente

dispersos concretamente se dirigiacutea a la

comunidad de fiacutesicos de altas energiacuteas

vinculados al CERN

Se pretendiacutea que los recursos disponibles

en formato electroacutenico que residen en

ordenadores distintos conectados a la red

fuesen accesibles para cada investigador

desde su terminal de forma transparente

y exento de dificultades sin necesidad de

aprender a utilizar varios programas

distintos Ademaacutes deberiacutea posibilitarse el

salto entre elementos de informacioacuten

conexos Los recursos existentes

deberiacutean integrarse en una red

hipertextual distribuida gestionada por

ordenadores

Gracias a una diseminacioacuten

relampagueante de tecnologiacuteas y

protocolos el mundo gozoacute de

repente de acceso instantaacuteneo a

cualquier tipo de informacioacuten

Todo esto hace que cambie el

grado de mediacioacuten humana para

obtener acceso a la informacioacuten

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 12: bucear y encontrar en internet

ldquoEl ciberespaciocualquiera que se conecte ahora tiene que saber que es un universo entero Y cada antildeo

hay maacutes cosas ahiacute dentro

las cosas permanentemente cambianhellip

Internet la tribu planetaria

coacutemo y cuaacutendo

Internet que se originoacute en el aacutembito militar durante

la guerra friacutea se habiacutea desarrollado maacutes allaacute de

los propoacutesitos originales como resultado de su uso

por parte la comunidad cientiacutefica internacional

que necesitaba nuevos sistemas de distribucioacuten

de la informacioacuten

en el principio fue un desarrollo del Departamento de

Defensa USAhellipy estamos en los

antildeos 60

A finales de la deacutecada de los ochenta la

interconexioacuten de miles de redes de aacuterea

local habiacutea convertido Internet en el mayor

almaceacuten de datos que jamaacutes hubiese

existido pero tambieacuten en el maacutes caoacutetico

Raacutepido barato y sin control

el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip

el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip

convertido en el lema de habituales de Internet y que explica el

crecimiento explosivo de la red

FAST CHEAP AND OUT OF CONTROL

coacutemo funciona

La caracteriacutestica primordial de Internet es la de ser

un sistema universal de comunicaciones capaz de

acomodar la maacutes absoluta diversidad

El aglutinante es el conjunto de normas y

lenguajes comunes de comunicacioacuten entre

sistemas conocido como familia de protocolos

TCPIP que permiten la transmisioacuten de datos

Este nombre geneacuterico engloba maacutes de 100

normas o protocolos abiertos que se han

convertido en estaacutendar ldquode factordquo Cada uno da

solucioacuten a un aspecto especiacutefico

Su nombre hace referencia a los dos protocolos

maacutes importantes

-IP (Internet Protocol) transmite los datos de un

lugar a otro de forma fragmentada (en

paquetes)

-TCP (Transmission Control Protocol) asegura

una comunicacioacuten segura y fiable

Entre estos 100 muchos nos son familiares

bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web

bullFTP (File Transfer Protocol) para transferencia de archivos

bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico

bullTELNET para acceder a equipos remotos

la arquitectura de la red

Sigue el modelo cliente-servidor un

paradigma de divisioacuten del trabajo

informaacutetico en el que las tareas se reparten

entre un nuacutemero de clientes que efectuacutean

peticiones de servicios de acuerdo con un

protocolo y un nuacutemero de servidores que

las atienden

explorando Internet

Se ha buscado formas de estructurar el inmenso volumen de

informacioacuten distribuido en miles de nodos de la red

bullGopher servicio de informacioacuten sobre los recursos de

Internet organizado en miles de servidores interconectados

La informacioacuten se presenta clasificada por tipos y accesible

mediante menuacutes jeraacuterquicos

bullWAIS realiza buacutesquedas por contenidos en grandes

documentos textuales o bases de datos

bullWWW (World Wide Web) integra todo lo anterior

novedades conceptuales hipertexto hipermedia

bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para

referirse a un cuerpo de material escrito o graacutefico

interconectado de un modo complejo que no se puede

representar convenientemente sobre el papel puede

contener anotaciones adiciones y notas de los estudiosos

que lo examinanrdquo Era el tiempo del proyecto Xanaduacute

bullLa idea es que el lector examina los nodos de una red y

pasa de unos a otros siguiendo las conexiones (links en

ingleacutes) El hecho de que los nodos pueden contener texto

pero tambieacuten pueden integrar otros medios imagen

sonido etc es lo que se quiere remarcar con otro teacutermino

complementario `hipermedia

El proyecto Xanaduacute de Ted Nelson

cambiariacutea el modo de almacenar

clasificar y pagar la informacioacuten

Habriacutea que esperarhellipXanaduacute no

llegoacute a aplicaciones praacutecticas

Estas nuevas tecnologiacuteas permitiraacuten la idea de

una red de elementos de informacioacuten

libremente accesible alrededor del mundo y

seraacute posible en la World-Wide-Web

Internet como telarantildea

el World-Wide-Web

El proyecto World-Wide-Web del CERN dirigido

por Tim Berners-Lee supone otra vuelta de

tuerca en el intento de poner efectivamente al

alcance de los usuarios el espacio virtual de

conocimiento que es Internet un interface

unificado para el acceso a informacioacuten

distribuida

CERN Organizacioacuten Europea para la Investigacioacuten Nuclear

World-Wide-Web (abreviado `Web escrito

tambieacuten `WWW o incluso `W3) significa algo

asiacute como `red (o telarantildea) global La

propaganda oficial del CERN lo define como

un sistema hipermedia distribuido En

principioacute se pensoacute como un medio para la

distribucioacuten de la informacioacuten entre equipos

de investigadores geograacuteficamente

dispersos concretamente se dirigiacutea a la

comunidad de fiacutesicos de altas energiacuteas

vinculados al CERN

Se pretendiacutea que los recursos disponibles

en formato electroacutenico que residen en

ordenadores distintos conectados a la red

fuesen accesibles para cada investigador

desde su terminal de forma transparente

y exento de dificultades sin necesidad de

aprender a utilizar varios programas

distintos Ademaacutes deberiacutea posibilitarse el

salto entre elementos de informacioacuten

conexos Los recursos existentes

deberiacutean integrarse en una red

hipertextual distribuida gestionada por

ordenadores

Gracias a una diseminacioacuten

relampagueante de tecnologiacuteas y

protocolos el mundo gozoacute de

repente de acceso instantaacuteneo a

cualquier tipo de informacioacuten

Todo esto hace que cambie el

grado de mediacioacuten humana para

obtener acceso a la informacioacuten

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 13: bucear y encontrar en internet

Internet la tribu planetaria

coacutemo y cuaacutendo

Internet que se originoacute en el aacutembito militar durante

la guerra friacutea se habiacutea desarrollado maacutes allaacute de

los propoacutesitos originales como resultado de su uso

por parte la comunidad cientiacutefica internacional

que necesitaba nuevos sistemas de distribucioacuten

de la informacioacuten

en el principio fue un desarrollo del Departamento de

Defensa USAhellipy estamos en los

antildeos 60

A finales de la deacutecada de los ochenta la

interconexioacuten de miles de redes de aacuterea

local habiacutea convertido Internet en el mayor

almaceacuten de datos que jamaacutes hubiese

existido pero tambieacuten en el maacutes caoacutetico

Raacutepido barato y sin control

el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip

el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip

convertido en el lema de habituales de Internet y que explica el

crecimiento explosivo de la red

FAST CHEAP AND OUT OF CONTROL

coacutemo funciona

La caracteriacutestica primordial de Internet es la de ser

un sistema universal de comunicaciones capaz de

acomodar la maacutes absoluta diversidad

El aglutinante es el conjunto de normas y

lenguajes comunes de comunicacioacuten entre

sistemas conocido como familia de protocolos

TCPIP que permiten la transmisioacuten de datos

Este nombre geneacuterico engloba maacutes de 100

normas o protocolos abiertos que se han

convertido en estaacutendar ldquode factordquo Cada uno da

solucioacuten a un aspecto especiacutefico

Su nombre hace referencia a los dos protocolos

maacutes importantes

-IP (Internet Protocol) transmite los datos de un

lugar a otro de forma fragmentada (en

paquetes)

-TCP (Transmission Control Protocol) asegura

una comunicacioacuten segura y fiable

Entre estos 100 muchos nos son familiares

bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web

bullFTP (File Transfer Protocol) para transferencia de archivos

bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico

bullTELNET para acceder a equipos remotos

la arquitectura de la red

Sigue el modelo cliente-servidor un

paradigma de divisioacuten del trabajo

informaacutetico en el que las tareas se reparten

entre un nuacutemero de clientes que efectuacutean

peticiones de servicios de acuerdo con un

protocolo y un nuacutemero de servidores que

las atienden

explorando Internet

Se ha buscado formas de estructurar el inmenso volumen de

informacioacuten distribuido en miles de nodos de la red

bullGopher servicio de informacioacuten sobre los recursos de

Internet organizado en miles de servidores interconectados

La informacioacuten se presenta clasificada por tipos y accesible

mediante menuacutes jeraacuterquicos

bullWAIS realiza buacutesquedas por contenidos en grandes

documentos textuales o bases de datos

bullWWW (World Wide Web) integra todo lo anterior

novedades conceptuales hipertexto hipermedia

bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para

referirse a un cuerpo de material escrito o graacutefico

interconectado de un modo complejo que no se puede

representar convenientemente sobre el papel puede

contener anotaciones adiciones y notas de los estudiosos

que lo examinanrdquo Era el tiempo del proyecto Xanaduacute

bullLa idea es que el lector examina los nodos de una red y

pasa de unos a otros siguiendo las conexiones (links en

ingleacutes) El hecho de que los nodos pueden contener texto

pero tambieacuten pueden integrar otros medios imagen

sonido etc es lo que se quiere remarcar con otro teacutermino

complementario `hipermedia

El proyecto Xanaduacute de Ted Nelson

cambiariacutea el modo de almacenar

clasificar y pagar la informacioacuten

Habriacutea que esperarhellipXanaduacute no

llegoacute a aplicaciones praacutecticas

Estas nuevas tecnologiacuteas permitiraacuten la idea de

una red de elementos de informacioacuten

libremente accesible alrededor del mundo y

seraacute posible en la World-Wide-Web

Internet como telarantildea

el World-Wide-Web

El proyecto World-Wide-Web del CERN dirigido

por Tim Berners-Lee supone otra vuelta de

tuerca en el intento de poner efectivamente al

alcance de los usuarios el espacio virtual de

conocimiento que es Internet un interface

unificado para el acceso a informacioacuten

distribuida

CERN Organizacioacuten Europea para la Investigacioacuten Nuclear

World-Wide-Web (abreviado `Web escrito

tambieacuten `WWW o incluso `W3) significa algo

asiacute como `red (o telarantildea) global La

propaganda oficial del CERN lo define como

un sistema hipermedia distribuido En

principioacute se pensoacute como un medio para la

distribucioacuten de la informacioacuten entre equipos

de investigadores geograacuteficamente

dispersos concretamente se dirigiacutea a la

comunidad de fiacutesicos de altas energiacuteas

vinculados al CERN

Se pretendiacutea que los recursos disponibles

en formato electroacutenico que residen en

ordenadores distintos conectados a la red

fuesen accesibles para cada investigador

desde su terminal de forma transparente

y exento de dificultades sin necesidad de

aprender a utilizar varios programas

distintos Ademaacutes deberiacutea posibilitarse el

salto entre elementos de informacioacuten

conexos Los recursos existentes

deberiacutean integrarse en una red

hipertextual distribuida gestionada por

ordenadores

Gracias a una diseminacioacuten

relampagueante de tecnologiacuteas y

protocolos el mundo gozoacute de

repente de acceso instantaacuteneo a

cualquier tipo de informacioacuten

Todo esto hace que cambie el

grado de mediacioacuten humana para

obtener acceso a la informacioacuten

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 14: bucear y encontrar en internet

coacutemo y cuaacutendo

Internet que se originoacute en el aacutembito militar durante

la guerra friacutea se habiacutea desarrollado maacutes allaacute de

los propoacutesitos originales como resultado de su uso

por parte la comunidad cientiacutefica internacional

que necesitaba nuevos sistemas de distribucioacuten

de la informacioacuten

en el principio fue un desarrollo del Departamento de

Defensa USAhellipy estamos en los

antildeos 60

A finales de la deacutecada de los ochenta la

interconexioacuten de miles de redes de aacuterea

local habiacutea convertido Internet en el mayor

almaceacuten de datos que jamaacutes hubiese

existido pero tambieacuten en el maacutes caoacutetico

Raacutepido barato y sin control

el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip

el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip

convertido en el lema de habituales de Internet y que explica el

crecimiento explosivo de la red

FAST CHEAP AND OUT OF CONTROL

coacutemo funciona

La caracteriacutestica primordial de Internet es la de ser

un sistema universal de comunicaciones capaz de

acomodar la maacutes absoluta diversidad

El aglutinante es el conjunto de normas y

lenguajes comunes de comunicacioacuten entre

sistemas conocido como familia de protocolos

TCPIP que permiten la transmisioacuten de datos

Este nombre geneacuterico engloba maacutes de 100

normas o protocolos abiertos que se han

convertido en estaacutendar ldquode factordquo Cada uno da

solucioacuten a un aspecto especiacutefico

Su nombre hace referencia a los dos protocolos

maacutes importantes

-IP (Internet Protocol) transmite los datos de un

lugar a otro de forma fragmentada (en

paquetes)

-TCP (Transmission Control Protocol) asegura

una comunicacioacuten segura y fiable

Entre estos 100 muchos nos son familiares

bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web

bullFTP (File Transfer Protocol) para transferencia de archivos

bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico

bullTELNET para acceder a equipos remotos

la arquitectura de la red

Sigue el modelo cliente-servidor un

paradigma de divisioacuten del trabajo

informaacutetico en el que las tareas se reparten

entre un nuacutemero de clientes que efectuacutean

peticiones de servicios de acuerdo con un

protocolo y un nuacutemero de servidores que

las atienden

explorando Internet

Se ha buscado formas de estructurar el inmenso volumen de

informacioacuten distribuido en miles de nodos de la red

bullGopher servicio de informacioacuten sobre los recursos de

Internet organizado en miles de servidores interconectados

La informacioacuten se presenta clasificada por tipos y accesible

mediante menuacutes jeraacuterquicos

bullWAIS realiza buacutesquedas por contenidos en grandes

documentos textuales o bases de datos

bullWWW (World Wide Web) integra todo lo anterior

novedades conceptuales hipertexto hipermedia

bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para

referirse a un cuerpo de material escrito o graacutefico

interconectado de un modo complejo que no se puede

representar convenientemente sobre el papel puede

contener anotaciones adiciones y notas de los estudiosos

que lo examinanrdquo Era el tiempo del proyecto Xanaduacute

bullLa idea es que el lector examina los nodos de una red y

pasa de unos a otros siguiendo las conexiones (links en

ingleacutes) El hecho de que los nodos pueden contener texto

pero tambieacuten pueden integrar otros medios imagen

sonido etc es lo que se quiere remarcar con otro teacutermino

complementario `hipermedia

El proyecto Xanaduacute de Ted Nelson

cambiariacutea el modo de almacenar

clasificar y pagar la informacioacuten

Habriacutea que esperarhellipXanaduacute no

llegoacute a aplicaciones praacutecticas

Estas nuevas tecnologiacuteas permitiraacuten la idea de

una red de elementos de informacioacuten

libremente accesible alrededor del mundo y

seraacute posible en la World-Wide-Web

Internet como telarantildea

el World-Wide-Web

El proyecto World-Wide-Web del CERN dirigido

por Tim Berners-Lee supone otra vuelta de

tuerca en el intento de poner efectivamente al

alcance de los usuarios el espacio virtual de

conocimiento que es Internet un interface

unificado para el acceso a informacioacuten

distribuida

CERN Organizacioacuten Europea para la Investigacioacuten Nuclear

World-Wide-Web (abreviado `Web escrito

tambieacuten `WWW o incluso `W3) significa algo

asiacute como `red (o telarantildea) global La

propaganda oficial del CERN lo define como

un sistema hipermedia distribuido En

principioacute se pensoacute como un medio para la

distribucioacuten de la informacioacuten entre equipos

de investigadores geograacuteficamente

dispersos concretamente se dirigiacutea a la

comunidad de fiacutesicos de altas energiacuteas

vinculados al CERN

Se pretendiacutea que los recursos disponibles

en formato electroacutenico que residen en

ordenadores distintos conectados a la red

fuesen accesibles para cada investigador

desde su terminal de forma transparente

y exento de dificultades sin necesidad de

aprender a utilizar varios programas

distintos Ademaacutes deberiacutea posibilitarse el

salto entre elementos de informacioacuten

conexos Los recursos existentes

deberiacutean integrarse en una red

hipertextual distribuida gestionada por

ordenadores

Gracias a una diseminacioacuten

relampagueante de tecnologiacuteas y

protocolos el mundo gozoacute de

repente de acceso instantaacuteneo a

cualquier tipo de informacioacuten

Todo esto hace que cambie el

grado de mediacioacuten humana para

obtener acceso a la informacioacuten

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 15: bucear y encontrar en internet

A finales de la deacutecada de los ochenta la

interconexioacuten de miles de redes de aacuterea

local habiacutea convertido Internet en el mayor

almaceacuten de datos que jamaacutes hubiese

existido pero tambieacuten en el maacutes caoacutetico

Raacutepido barato y sin control

el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip

el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip

convertido en el lema de habituales de Internet y que explica el

crecimiento explosivo de la red

FAST CHEAP AND OUT OF CONTROL

coacutemo funciona

La caracteriacutestica primordial de Internet es la de ser

un sistema universal de comunicaciones capaz de

acomodar la maacutes absoluta diversidad

El aglutinante es el conjunto de normas y

lenguajes comunes de comunicacioacuten entre

sistemas conocido como familia de protocolos

TCPIP que permiten la transmisioacuten de datos

Este nombre geneacuterico engloba maacutes de 100

normas o protocolos abiertos que se han

convertido en estaacutendar ldquode factordquo Cada uno da

solucioacuten a un aspecto especiacutefico

Su nombre hace referencia a los dos protocolos

maacutes importantes

-IP (Internet Protocol) transmite los datos de un

lugar a otro de forma fragmentada (en

paquetes)

-TCP (Transmission Control Protocol) asegura

una comunicacioacuten segura y fiable

Entre estos 100 muchos nos son familiares

bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web

bullFTP (File Transfer Protocol) para transferencia de archivos

bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico

bullTELNET para acceder a equipos remotos

la arquitectura de la red

Sigue el modelo cliente-servidor un

paradigma de divisioacuten del trabajo

informaacutetico en el que las tareas se reparten

entre un nuacutemero de clientes que efectuacutean

peticiones de servicios de acuerdo con un

protocolo y un nuacutemero de servidores que

las atienden

explorando Internet

Se ha buscado formas de estructurar el inmenso volumen de

informacioacuten distribuido en miles de nodos de la red

bullGopher servicio de informacioacuten sobre los recursos de

Internet organizado en miles de servidores interconectados

La informacioacuten se presenta clasificada por tipos y accesible

mediante menuacutes jeraacuterquicos

bullWAIS realiza buacutesquedas por contenidos en grandes

documentos textuales o bases de datos

bullWWW (World Wide Web) integra todo lo anterior

novedades conceptuales hipertexto hipermedia

bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para

referirse a un cuerpo de material escrito o graacutefico

interconectado de un modo complejo que no se puede

representar convenientemente sobre el papel puede

contener anotaciones adiciones y notas de los estudiosos

que lo examinanrdquo Era el tiempo del proyecto Xanaduacute

bullLa idea es que el lector examina los nodos de una red y

pasa de unos a otros siguiendo las conexiones (links en

ingleacutes) El hecho de que los nodos pueden contener texto

pero tambieacuten pueden integrar otros medios imagen

sonido etc es lo que se quiere remarcar con otro teacutermino

complementario `hipermedia

El proyecto Xanaduacute de Ted Nelson

cambiariacutea el modo de almacenar

clasificar y pagar la informacioacuten

Habriacutea que esperarhellipXanaduacute no

llegoacute a aplicaciones praacutecticas

Estas nuevas tecnologiacuteas permitiraacuten la idea de

una red de elementos de informacioacuten

libremente accesible alrededor del mundo y

seraacute posible en la World-Wide-Web

Internet como telarantildea

el World-Wide-Web

El proyecto World-Wide-Web del CERN dirigido

por Tim Berners-Lee supone otra vuelta de

tuerca en el intento de poner efectivamente al

alcance de los usuarios el espacio virtual de

conocimiento que es Internet un interface

unificado para el acceso a informacioacuten

distribuida

CERN Organizacioacuten Europea para la Investigacioacuten Nuclear

World-Wide-Web (abreviado `Web escrito

tambieacuten `WWW o incluso `W3) significa algo

asiacute como `red (o telarantildea) global La

propaganda oficial del CERN lo define como

un sistema hipermedia distribuido En

principioacute se pensoacute como un medio para la

distribucioacuten de la informacioacuten entre equipos

de investigadores geograacuteficamente

dispersos concretamente se dirigiacutea a la

comunidad de fiacutesicos de altas energiacuteas

vinculados al CERN

Se pretendiacutea que los recursos disponibles

en formato electroacutenico que residen en

ordenadores distintos conectados a la red

fuesen accesibles para cada investigador

desde su terminal de forma transparente

y exento de dificultades sin necesidad de

aprender a utilizar varios programas

distintos Ademaacutes deberiacutea posibilitarse el

salto entre elementos de informacioacuten

conexos Los recursos existentes

deberiacutean integrarse en una red

hipertextual distribuida gestionada por

ordenadores

Gracias a una diseminacioacuten

relampagueante de tecnologiacuteas y

protocolos el mundo gozoacute de

repente de acceso instantaacuteneo a

cualquier tipo de informacioacuten

Todo esto hace que cambie el

grado de mediacioacuten humana para

obtener acceso a la informacioacuten

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 16: bucear y encontrar en internet

Raacutepido barato y sin control

el tiacutetulo de un artiacuteculo de investigadores del MIT sobre roboacutetica en 1984hellip

el tiacutetulo de una peliacutecula de Errol Morris de 1997hellip

convertido en el lema de habituales de Internet y que explica el

crecimiento explosivo de la red

FAST CHEAP AND OUT OF CONTROL

coacutemo funciona

La caracteriacutestica primordial de Internet es la de ser

un sistema universal de comunicaciones capaz de

acomodar la maacutes absoluta diversidad

El aglutinante es el conjunto de normas y

lenguajes comunes de comunicacioacuten entre

sistemas conocido como familia de protocolos

TCPIP que permiten la transmisioacuten de datos

Este nombre geneacuterico engloba maacutes de 100

normas o protocolos abiertos que se han

convertido en estaacutendar ldquode factordquo Cada uno da

solucioacuten a un aspecto especiacutefico

Su nombre hace referencia a los dos protocolos

maacutes importantes

-IP (Internet Protocol) transmite los datos de un

lugar a otro de forma fragmentada (en

paquetes)

-TCP (Transmission Control Protocol) asegura

una comunicacioacuten segura y fiable

Entre estos 100 muchos nos son familiares

bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web

bullFTP (File Transfer Protocol) para transferencia de archivos

bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico

bullTELNET para acceder a equipos remotos

la arquitectura de la red

Sigue el modelo cliente-servidor un

paradigma de divisioacuten del trabajo

informaacutetico en el que las tareas se reparten

entre un nuacutemero de clientes que efectuacutean

peticiones de servicios de acuerdo con un

protocolo y un nuacutemero de servidores que

las atienden

explorando Internet

Se ha buscado formas de estructurar el inmenso volumen de

informacioacuten distribuido en miles de nodos de la red

bullGopher servicio de informacioacuten sobre los recursos de

Internet organizado en miles de servidores interconectados

La informacioacuten se presenta clasificada por tipos y accesible

mediante menuacutes jeraacuterquicos

bullWAIS realiza buacutesquedas por contenidos en grandes

documentos textuales o bases de datos

bullWWW (World Wide Web) integra todo lo anterior

novedades conceptuales hipertexto hipermedia

bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para

referirse a un cuerpo de material escrito o graacutefico

interconectado de un modo complejo que no se puede

representar convenientemente sobre el papel puede

contener anotaciones adiciones y notas de los estudiosos

que lo examinanrdquo Era el tiempo del proyecto Xanaduacute

bullLa idea es que el lector examina los nodos de una red y

pasa de unos a otros siguiendo las conexiones (links en

ingleacutes) El hecho de que los nodos pueden contener texto

pero tambieacuten pueden integrar otros medios imagen

sonido etc es lo que se quiere remarcar con otro teacutermino

complementario `hipermedia

El proyecto Xanaduacute de Ted Nelson

cambiariacutea el modo de almacenar

clasificar y pagar la informacioacuten

Habriacutea que esperarhellipXanaduacute no

llegoacute a aplicaciones praacutecticas

Estas nuevas tecnologiacuteas permitiraacuten la idea de

una red de elementos de informacioacuten

libremente accesible alrededor del mundo y

seraacute posible en la World-Wide-Web

Internet como telarantildea

el World-Wide-Web

El proyecto World-Wide-Web del CERN dirigido

por Tim Berners-Lee supone otra vuelta de

tuerca en el intento de poner efectivamente al

alcance de los usuarios el espacio virtual de

conocimiento que es Internet un interface

unificado para el acceso a informacioacuten

distribuida

CERN Organizacioacuten Europea para la Investigacioacuten Nuclear

World-Wide-Web (abreviado `Web escrito

tambieacuten `WWW o incluso `W3) significa algo

asiacute como `red (o telarantildea) global La

propaganda oficial del CERN lo define como

un sistema hipermedia distribuido En

principioacute se pensoacute como un medio para la

distribucioacuten de la informacioacuten entre equipos

de investigadores geograacuteficamente

dispersos concretamente se dirigiacutea a la

comunidad de fiacutesicos de altas energiacuteas

vinculados al CERN

Se pretendiacutea que los recursos disponibles

en formato electroacutenico que residen en

ordenadores distintos conectados a la red

fuesen accesibles para cada investigador

desde su terminal de forma transparente

y exento de dificultades sin necesidad de

aprender a utilizar varios programas

distintos Ademaacutes deberiacutea posibilitarse el

salto entre elementos de informacioacuten

conexos Los recursos existentes

deberiacutean integrarse en una red

hipertextual distribuida gestionada por

ordenadores

Gracias a una diseminacioacuten

relampagueante de tecnologiacuteas y

protocolos el mundo gozoacute de

repente de acceso instantaacuteneo a

cualquier tipo de informacioacuten

Todo esto hace que cambie el

grado de mediacioacuten humana para

obtener acceso a la informacioacuten

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 17: bucear y encontrar en internet

coacutemo funciona

La caracteriacutestica primordial de Internet es la de ser

un sistema universal de comunicaciones capaz de

acomodar la maacutes absoluta diversidad

El aglutinante es el conjunto de normas y

lenguajes comunes de comunicacioacuten entre

sistemas conocido como familia de protocolos

TCPIP que permiten la transmisioacuten de datos

Este nombre geneacuterico engloba maacutes de 100

normas o protocolos abiertos que se han

convertido en estaacutendar ldquode factordquo Cada uno da

solucioacuten a un aspecto especiacutefico

Su nombre hace referencia a los dos protocolos

maacutes importantes

-IP (Internet Protocol) transmite los datos de un

lugar a otro de forma fragmentada (en

paquetes)

-TCP (Transmission Control Protocol) asegura

una comunicacioacuten segura y fiable

Entre estos 100 muchos nos son familiares

bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web

bullFTP (File Transfer Protocol) para transferencia de archivos

bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico

bullTELNET para acceder a equipos remotos

la arquitectura de la red

Sigue el modelo cliente-servidor un

paradigma de divisioacuten del trabajo

informaacutetico en el que las tareas se reparten

entre un nuacutemero de clientes que efectuacutean

peticiones de servicios de acuerdo con un

protocolo y un nuacutemero de servidores que

las atienden

explorando Internet

Se ha buscado formas de estructurar el inmenso volumen de

informacioacuten distribuido en miles de nodos de la red

bullGopher servicio de informacioacuten sobre los recursos de

Internet organizado en miles de servidores interconectados

La informacioacuten se presenta clasificada por tipos y accesible

mediante menuacutes jeraacuterquicos

bullWAIS realiza buacutesquedas por contenidos en grandes

documentos textuales o bases de datos

bullWWW (World Wide Web) integra todo lo anterior

novedades conceptuales hipertexto hipermedia

bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para

referirse a un cuerpo de material escrito o graacutefico

interconectado de un modo complejo que no se puede

representar convenientemente sobre el papel puede

contener anotaciones adiciones y notas de los estudiosos

que lo examinanrdquo Era el tiempo del proyecto Xanaduacute

bullLa idea es que el lector examina los nodos de una red y

pasa de unos a otros siguiendo las conexiones (links en

ingleacutes) El hecho de que los nodos pueden contener texto

pero tambieacuten pueden integrar otros medios imagen

sonido etc es lo que se quiere remarcar con otro teacutermino

complementario `hipermedia

El proyecto Xanaduacute de Ted Nelson

cambiariacutea el modo de almacenar

clasificar y pagar la informacioacuten

Habriacutea que esperarhellipXanaduacute no

llegoacute a aplicaciones praacutecticas

Estas nuevas tecnologiacuteas permitiraacuten la idea de

una red de elementos de informacioacuten

libremente accesible alrededor del mundo y

seraacute posible en la World-Wide-Web

Internet como telarantildea

el World-Wide-Web

El proyecto World-Wide-Web del CERN dirigido

por Tim Berners-Lee supone otra vuelta de

tuerca en el intento de poner efectivamente al

alcance de los usuarios el espacio virtual de

conocimiento que es Internet un interface

unificado para el acceso a informacioacuten

distribuida

CERN Organizacioacuten Europea para la Investigacioacuten Nuclear

World-Wide-Web (abreviado `Web escrito

tambieacuten `WWW o incluso `W3) significa algo

asiacute como `red (o telarantildea) global La

propaganda oficial del CERN lo define como

un sistema hipermedia distribuido En

principioacute se pensoacute como un medio para la

distribucioacuten de la informacioacuten entre equipos

de investigadores geograacuteficamente

dispersos concretamente se dirigiacutea a la

comunidad de fiacutesicos de altas energiacuteas

vinculados al CERN

Se pretendiacutea que los recursos disponibles

en formato electroacutenico que residen en

ordenadores distintos conectados a la red

fuesen accesibles para cada investigador

desde su terminal de forma transparente

y exento de dificultades sin necesidad de

aprender a utilizar varios programas

distintos Ademaacutes deberiacutea posibilitarse el

salto entre elementos de informacioacuten

conexos Los recursos existentes

deberiacutean integrarse en una red

hipertextual distribuida gestionada por

ordenadores

Gracias a una diseminacioacuten

relampagueante de tecnologiacuteas y

protocolos el mundo gozoacute de

repente de acceso instantaacuteneo a

cualquier tipo de informacioacuten

Todo esto hace que cambie el

grado de mediacioacuten humana para

obtener acceso a la informacioacuten

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 18: bucear y encontrar en internet

Este nombre geneacuterico engloba maacutes de 100

normas o protocolos abiertos que se han

convertido en estaacutendar ldquode factordquo Cada uno da

solucioacuten a un aspecto especiacutefico

Su nombre hace referencia a los dos protocolos

maacutes importantes

-IP (Internet Protocol) transmite los datos de un

lugar a otro de forma fragmentada (en

paquetes)

-TCP (Transmission Control Protocol) asegura

una comunicacioacuten segura y fiable

Entre estos 100 muchos nos son familiares

bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web

bullFTP (File Transfer Protocol) para transferencia de archivos

bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico

bullTELNET para acceder a equipos remotos

la arquitectura de la red

Sigue el modelo cliente-servidor un

paradigma de divisioacuten del trabajo

informaacutetico en el que las tareas se reparten

entre un nuacutemero de clientes que efectuacutean

peticiones de servicios de acuerdo con un

protocolo y un nuacutemero de servidores que

las atienden

explorando Internet

Se ha buscado formas de estructurar el inmenso volumen de

informacioacuten distribuido en miles de nodos de la red

bullGopher servicio de informacioacuten sobre los recursos de

Internet organizado en miles de servidores interconectados

La informacioacuten se presenta clasificada por tipos y accesible

mediante menuacutes jeraacuterquicos

bullWAIS realiza buacutesquedas por contenidos en grandes

documentos textuales o bases de datos

bullWWW (World Wide Web) integra todo lo anterior

novedades conceptuales hipertexto hipermedia

bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para

referirse a un cuerpo de material escrito o graacutefico

interconectado de un modo complejo que no se puede

representar convenientemente sobre el papel puede

contener anotaciones adiciones y notas de los estudiosos

que lo examinanrdquo Era el tiempo del proyecto Xanaduacute

bullLa idea es que el lector examina los nodos de una red y

pasa de unos a otros siguiendo las conexiones (links en

ingleacutes) El hecho de que los nodos pueden contener texto

pero tambieacuten pueden integrar otros medios imagen

sonido etc es lo que se quiere remarcar con otro teacutermino

complementario `hipermedia

El proyecto Xanaduacute de Ted Nelson

cambiariacutea el modo de almacenar

clasificar y pagar la informacioacuten

Habriacutea que esperarhellipXanaduacute no

llegoacute a aplicaciones praacutecticas

Estas nuevas tecnologiacuteas permitiraacuten la idea de

una red de elementos de informacioacuten

libremente accesible alrededor del mundo y

seraacute posible en la World-Wide-Web

Internet como telarantildea

el World-Wide-Web

El proyecto World-Wide-Web del CERN dirigido

por Tim Berners-Lee supone otra vuelta de

tuerca en el intento de poner efectivamente al

alcance de los usuarios el espacio virtual de

conocimiento que es Internet un interface

unificado para el acceso a informacioacuten

distribuida

CERN Organizacioacuten Europea para la Investigacioacuten Nuclear

World-Wide-Web (abreviado `Web escrito

tambieacuten `WWW o incluso `W3) significa algo

asiacute como `red (o telarantildea) global La

propaganda oficial del CERN lo define como

un sistema hipermedia distribuido En

principioacute se pensoacute como un medio para la

distribucioacuten de la informacioacuten entre equipos

de investigadores geograacuteficamente

dispersos concretamente se dirigiacutea a la

comunidad de fiacutesicos de altas energiacuteas

vinculados al CERN

Se pretendiacutea que los recursos disponibles

en formato electroacutenico que residen en

ordenadores distintos conectados a la red

fuesen accesibles para cada investigador

desde su terminal de forma transparente

y exento de dificultades sin necesidad de

aprender a utilizar varios programas

distintos Ademaacutes deberiacutea posibilitarse el

salto entre elementos de informacioacuten

conexos Los recursos existentes

deberiacutean integrarse en una red

hipertextual distribuida gestionada por

ordenadores

Gracias a una diseminacioacuten

relampagueante de tecnologiacuteas y

protocolos el mundo gozoacute de

repente de acceso instantaacuteneo a

cualquier tipo de informacioacuten

Todo esto hace que cambie el

grado de mediacioacuten humana para

obtener acceso a la informacioacuten

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 19: bucear y encontrar en internet

Entre estos 100 muchos nos son familiares

bullHTTP (HyperText Transfer Protocol) que es el que se utiliza para acceder a las paacuteginas web

bullFTP (File Transfer Protocol) para transferencia de archivos

bullSMTP (Simple Mail Transfer Protocol) y el POP (Post Office Protocol) para correo electroacutenico

bullTELNET para acceder a equipos remotos

la arquitectura de la red

Sigue el modelo cliente-servidor un

paradigma de divisioacuten del trabajo

informaacutetico en el que las tareas se reparten

entre un nuacutemero de clientes que efectuacutean

peticiones de servicios de acuerdo con un

protocolo y un nuacutemero de servidores que

las atienden

explorando Internet

Se ha buscado formas de estructurar el inmenso volumen de

informacioacuten distribuido en miles de nodos de la red

bullGopher servicio de informacioacuten sobre los recursos de

Internet organizado en miles de servidores interconectados

La informacioacuten se presenta clasificada por tipos y accesible

mediante menuacutes jeraacuterquicos

bullWAIS realiza buacutesquedas por contenidos en grandes

documentos textuales o bases de datos

bullWWW (World Wide Web) integra todo lo anterior

novedades conceptuales hipertexto hipermedia

bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para

referirse a un cuerpo de material escrito o graacutefico

interconectado de un modo complejo que no se puede

representar convenientemente sobre el papel puede

contener anotaciones adiciones y notas de los estudiosos

que lo examinanrdquo Era el tiempo del proyecto Xanaduacute

bullLa idea es que el lector examina los nodos de una red y

pasa de unos a otros siguiendo las conexiones (links en

ingleacutes) El hecho de que los nodos pueden contener texto

pero tambieacuten pueden integrar otros medios imagen

sonido etc es lo que se quiere remarcar con otro teacutermino

complementario `hipermedia

El proyecto Xanaduacute de Ted Nelson

cambiariacutea el modo de almacenar

clasificar y pagar la informacioacuten

Habriacutea que esperarhellipXanaduacute no

llegoacute a aplicaciones praacutecticas

Estas nuevas tecnologiacuteas permitiraacuten la idea de

una red de elementos de informacioacuten

libremente accesible alrededor del mundo y

seraacute posible en la World-Wide-Web

Internet como telarantildea

el World-Wide-Web

El proyecto World-Wide-Web del CERN dirigido

por Tim Berners-Lee supone otra vuelta de

tuerca en el intento de poner efectivamente al

alcance de los usuarios el espacio virtual de

conocimiento que es Internet un interface

unificado para el acceso a informacioacuten

distribuida

CERN Organizacioacuten Europea para la Investigacioacuten Nuclear

World-Wide-Web (abreviado `Web escrito

tambieacuten `WWW o incluso `W3) significa algo

asiacute como `red (o telarantildea) global La

propaganda oficial del CERN lo define como

un sistema hipermedia distribuido En

principioacute se pensoacute como un medio para la

distribucioacuten de la informacioacuten entre equipos

de investigadores geograacuteficamente

dispersos concretamente se dirigiacutea a la

comunidad de fiacutesicos de altas energiacuteas

vinculados al CERN

Se pretendiacutea que los recursos disponibles

en formato electroacutenico que residen en

ordenadores distintos conectados a la red

fuesen accesibles para cada investigador

desde su terminal de forma transparente

y exento de dificultades sin necesidad de

aprender a utilizar varios programas

distintos Ademaacutes deberiacutea posibilitarse el

salto entre elementos de informacioacuten

conexos Los recursos existentes

deberiacutean integrarse en una red

hipertextual distribuida gestionada por

ordenadores

Gracias a una diseminacioacuten

relampagueante de tecnologiacuteas y

protocolos el mundo gozoacute de

repente de acceso instantaacuteneo a

cualquier tipo de informacioacuten

Todo esto hace que cambie el

grado de mediacioacuten humana para

obtener acceso a la informacioacuten

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 20: bucear y encontrar en internet

la arquitectura de la red

Sigue el modelo cliente-servidor un

paradigma de divisioacuten del trabajo

informaacutetico en el que las tareas se reparten

entre un nuacutemero de clientes que efectuacutean

peticiones de servicios de acuerdo con un

protocolo y un nuacutemero de servidores que

las atienden

explorando Internet

Se ha buscado formas de estructurar el inmenso volumen de

informacioacuten distribuido en miles de nodos de la red

bullGopher servicio de informacioacuten sobre los recursos de

Internet organizado en miles de servidores interconectados

La informacioacuten se presenta clasificada por tipos y accesible

mediante menuacutes jeraacuterquicos

bullWAIS realiza buacutesquedas por contenidos en grandes

documentos textuales o bases de datos

bullWWW (World Wide Web) integra todo lo anterior

novedades conceptuales hipertexto hipermedia

bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para

referirse a un cuerpo de material escrito o graacutefico

interconectado de un modo complejo que no se puede

representar convenientemente sobre el papel puede

contener anotaciones adiciones y notas de los estudiosos

que lo examinanrdquo Era el tiempo del proyecto Xanaduacute

bullLa idea es que el lector examina los nodos de una red y

pasa de unos a otros siguiendo las conexiones (links en

ingleacutes) El hecho de que los nodos pueden contener texto

pero tambieacuten pueden integrar otros medios imagen

sonido etc es lo que se quiere remarcar con otro teacutermino

complementario `hipermedia

El proyecto Xanaduacute de Ted Nelson

cambiariacutea el modo de almacenar

clasificar y pagar la informacioacuten

Habriacutea que esperarhellipXanaduacute no

llegoacute a aplicaciones praacutecticas

Estas nuevas tecnologiacuteas permitiraacuten la idea de

una red de elementos de informacioacuten

libremente accesible alrededor del mundo y

seraacute posible en la World-Wide-Web

Internet como telarantildea

el World-Wide-Web

El proyecto World-Wide-Web del CERN dirigido

por Tim Berners-Lee supone otra vuelta de

tuerca en el intento de poner efectivamente al

alcance de los usuarios el espacio virtual de

conocimiento que es Internet un interface

unificado para el acceso a informacioacuten

distribuida

CERN Organizacioacuten Europea para la Investigacioacuten Nuclear

World-Wide-Web (abreviado `Web escrito

tambieacuten `WWW o incluso `W3) significa algo

asiacute como `red (o telarantildea) global La

propaganda oficial del CERN lo define como

un sistema hipermedia distribuido En

principioacute se pensoacute como un medio para la

distribucioacuten de la informacioacuten entre equipos

de investigadores geograacuteficamente

dispersos concretamente se dirigiacutea a la

comunidad de fiacutesicos de altas energiacuteas

vinculados al CERN

Se pretendiacutea que los recursos disponibles

en formato electroacutenico que residen en

ordenadores distintos conectados a la red

fuesen accesibles para cada investigador

desde su terminal de forma transparente

y exento de dificultades sin necesidad de

aprender a utilizar varios programas

distintos Ademaacutes deberiacutea posibilitarse el

salto entre elementos de informacioacuten

conexos Los recursos existentes

deberiacutean integrarse en una red

hipertextual distribuida gestionada por

ordenadores

Gracias a una diseminacioacuten

relampagueante de tecnologiacuteas y

protocolos el mundo gozoacute de

repente de acceso instantaacuteneo a

cualquier tipo de informacioacuten

Todo esto hace que cambie el

grado de mediacioacuten humana para

obtener acceso a la informacioacuten

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 21: bucear y encontrar en internet

explorando Internet

Se ha buscado formas de estructurar el inmenso volumen de

informacioacuten distribuido en miles de nodos de la red

bullGopher servicio de informacioacuten sobre los recursos de

Internet organizado en miles de servidores interconectados

La informacioacuten se presenta clasificada por tipos y accesible

mediante menuacutes jeraacuterquicos

bullWAIS realiza buacutesquedas por contenidos en grandes

documentos textuales o bases de datos

bullWWW (World Wide Web) integra todo lo anterior

novedades conceptuales hipertexto hipermedia

bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para

referirse a un cuerpo de material escrito o graacutefico

interconectado de un modo complejo que no se puede

representar convenientemente sobre el papel puede

contener anotaciones adiciones y notas de los estudiosos

que lo examinanrdquo Era el tiempo del proyecto Xanaduacute

bullLa idea es que el lector examina los nodos de una red y

pasa de unos a otros siguiendo las conexiones (links en

ingleacutes) El hecho de que los nodos pueden contener texto

pero tambieacuten pueden integrar otros medios imagen

sonido etc es lo que se quiere remarcar con otro teacutermino

complementario `hipermedia

El proyecto Xanaduacute de Ted Nelson

cambiariacutea el modo de almacenar

clasificar y pagar la informacioacuten

Habriacutea que esperarhellipXanaduacute no

llegoacute a aplicaciones praacutecticas

Estas nuevas tecnologiacuteas permitiraacuten la idea de

una red de elementos de informacioacuten

libremente accesible alrededor del mundo y

seraacute posible en la World-Wide-Web

Internet como telarantildea

el World-Wide-Web

El proyecto World-Wide-Web del CERN dirigido

por Tim Berners-Lee supone otra vuelta de

tuerca en el intento de poner efectivamente al

alcance de los usuarios el espacio virtual de

conocimiento que es Internet un interface

unificado para el acceso a informacioacuten

distribuida

CERN Organizacioacuten Europea para la Investigacioacuten Nuclear

World-Wide-Web (abreviado `Web escrito

tambieacuten `WWW o incluso `W3) significa algo

asiacute como `red (o telarantildea) global La

propaganda oficial del CERN lo define como

un sistema hipermedia distribuido En

principioacute se pensoacute como un medio para la

distribucioacuten de la informacioacuten entre equipos

de investigadores geograacuteficamente

dispersos concretamente se dirigiacutea a la

comunidad de fiacutesicos de altas energiacuteas

vinculados al CERN

Se pretendiacutea que los recursos disponibles

en formato electroacutenico que residen en

ordenadores distintos conectados a la red

fuesen accesibles para cada investigador

desde su terminal de forma transparente

y exento de dificultades sin necesidad de

aprender a utilizar varios programas

distintos Ademaacutes deberiacutea posibilitarse el

salto entre elementos de informacioacuten

conexos Los recursos existentes

deberiacutean integrarse en una red

hipertextual distribuida gestionada por

ordenadores

Gracias a una diseminacioacuten

relampagueante de tecnologiacuteas y

protocolos el mundo gozoacute de

repente de acceso instantaacuteneo a

cualquier tipo de informacioacuten

Todo esto hace que cambie el

grado de mediacioacuten humana para

obtener acceso a la informacioacuten

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 22: bucear y encontrar en internet

novedades conceptuales hipertexto hipermedia

bullTed Nelson inventoacute en 1965 el teacutermino `hipertexto para

referirse a un cuerpo de material escrito o graacutefico

interconectado de un modo complejo que no se puede

representar convenientemente sobre el papel puede

contener anotaciones adiciones y notas de los estudiosos

que lo examinanrdquo Era el tiempo del proyecto Xanaduacute

bullLa idea es que el lector examina los nodos de una red y

pasa de unos a otros siguiendo las conexiones (links en

ingleacutes) El hecho de que los nodos pueden contener texto

pero tambieacuten pueden integrar otros medios imagen

sonido etc es lo que se quiere remarcar con otro teacutermino

complementario `hipermedia

El proyecto Xanaduacute de Ted Nelson

cambiariacutea el modo de almacenar

clasificar y pagar la informacioacuten

Habriacutea que esperarhellipXanaduacute no

llegoacute a aplicaciones praacutecticas

Estas nuevas tecnologiacuteas permitiraacuten la idea de

una red de elementos de informacioacuten

libremente accesible alrededor del mundo y

seraacute posible en la World-Wide-Web

Internet como telarantildea

el World-Wide-Web

El proyecto World-Wide-Web del CERN dirigido

por Tim Berners-Lee supone otra vuelta de

tuerca en el intento de poner efectivamente al

alcance de los usuarios el espacio virtual de

conocimiento que es Internet un interface

unificado para el acceso a informacioacuten

distribuida

CERN Organizacioacuten Europea para la Investigacioacuten Nuclear

World-Wide-Web (abreviado `Web escrito

tambieacuten `WWW o incluso `W3) significa algo

asiacute como `red (o telarantildea) global La

propaganda oficial del CERN lo define como

un sistema hipermedia distribuido En

principioacute se pensoacute como un medio para la

distribucioacuten de la informacioacuten entre equipos

de investigadores geograacuteficamente

dispersos concretamente se dirigiacutea a la

comunidad de fiacutesicos de altas energiacuteas

vinculados al CERN

Se pretendiacutea que los recursos disponibles

en formato electroacutenico que residen en

ordenadores distintos conectados a la red

fuesen accesibles para cada investigador

desde su terminal de forma transparente

y exento de dificultades sin necesidad de

aprender a utilizar varios programas

distintos Ademaacutes deberiacutea posibilitarse el

salto entre elementos de informacioacuten

conexos Los recursos existentes

deberiacutean integrarse en una red

hipertextual distribuida gestionada por

ordenadores

Gracias a una diseminacioacuten

relampagueante de tecnologiacuteas y

protocolos el mundo gozoacute de

repente de acceso instantaacuteneo a

cualquier tipo de informacioacuten

Todo esto hace que cambie el

grado de mediacioacuten humana para

obtener acceso a la informacioacuten

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 23: bucear y encontrar en internet

El proyecto Xanaduacute de Ted Nelson

cambiariacutea el modo de almacenar

clasificar y pagar la informacioacuten

Habriacutea que esperarhellipXanaduacute no

llegoacute a aplicaciones praacutecticas

Estas nuevas tecnologiacuteas permitiraacuten la idea de

una red de elementos de informacioacuten

libremente accesible alrededor del mundo y

seraacute posible en la World-Wide-Web

Internet como telarantildea

el World-Wide-Web

El proyecto World-Wide-Web del CERN dirigido

por Tim Berners-Lee supone otra vuelta de

tuerca en el intento de poner efectivamente al

alcance de los usuarios el espacio virtual de

conocimiento que es Internet un interface

unificado para el acceso a informacioacuten

distribuida

CERN Organizacioacuten Europea para la Investigacioacuten Nuclear

World-Wide-Web (abreviado `Web escrito

tambieacuten `WWW o incluso `W3) significa algo

asiacute como `red (o telarantildea) global La

propaganda oficial del CERN lo define como

un sistema hipermedia distribuido En

principioacute se pensoacute como un medio para la

distribucioacuten de la informacioacuten entre equipos

de investigadores geograacuteficamente

dispersos concretamente se dirigiacutea a la

comunidad de fiacutesicos de altas energiacuteas

vinculados al CERN

Se pretendiacutea que los recursos disponibles

en formato electroacutenico que residen en

ordenadores distintos conectados a la red

fuesen accesibles para cada investigador

desde su terminal de forma transparente

y exento de dificultades sin necesidad de

aprender a utilizar varios programas

distintos Ademaacutes deberiacutea posibilitarse el

salto entre elementos de informacioacuten

conexos Los recursos existentes

deberiacutean integrarse en una red

hipertextual distribuida gestionada por

ordenadores

Gracias a una diseminacioacuten

relampagueante de tecnologiacuteas y

protocolos el mundo gozoacute de

repente de acceso instantaacuteneo a

cualquier tipo de informacioacuten

Todo esto hace que cambie el

grado de mediacioacuten humana para

obtener acceso a la informacioacuten

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 24: bucear y encontrar en internet

Estas nuevas tecnologiacuteas permitiraacuten la idea de

una red de elementos de informacioacuten

libremente accesible alrededor del mundo y

seraacute posible en la World-Wide-Web

Internet como telarantildea

el World-Wide-Web

El proyecto World-Wide-Web del CERN dirigido

por Tim Berners-Lee supone otra vuelta de

tuerca en el intento de poner efectivamente al

alcance de los usuarios el espacio virtual de

conocimiento que es Internet un interface

unificado para el acceso a informacioacuten

distribuida

CERN Organizacioacuten Europea para la Investigacioacuten Nuclear

World-Wide-Web (abreviado `Web escrito

tambieacuten `WWW o incluso `W3) significa algo

asiacute como `red (o telarantildea) global La

propaganda oficial del CERN lo define como

un sistema hipermedia distribuido En

principioacute se pensoacute como un medio para la

distribucioacuten de la informacioacuten entre equipos

de investigadores geograacuteficamente

dispersos concretamente se dirigiacutea a la

comunidad de fiacutesicos de altas energiacuteas

vinculados al CERN

Se pretendiacutea que los recursos disponibles

en formato electroacutenico que residen en

ordenadores distintos conectados a la red

fuesen accesibles para cada investigador

desde su terminal de forma transparente

y exento de dificultades sin necesidad de

aprender a utilizar varios programas

distintos Ademaacutes deberiacutea posibilitarse el

salto entre elementos de informacioacuten

conexos Los recursos existentes

deberiacutean integrarse en una red

hipertextual distribuida gestionada por

ordenadores

Gracias a una diseminacioacuten

relampagueante de tecnologiacuteas y

protocolos el mundo gozoacute de

repente de acceso instantaacuteneo a

cualquier tipo de informacioacuten

Todo esto hace que cambie el

grado de mediacioacuten humana para

obtener acceso a la informacioacuten

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 25: bucear y encontrar en internet

Internet como telarantildea

el World-Wide-Web

El proyecto World-Wide-Web del CERN dirigido

por Tim Berners-Lee supone otra vuelta de

tuerca en el intento de poner efectivamente al

alcance de los usuarios el espacio virtual de

conocimiento que es Internet un interface

unificado para el acceso a informacioacuten

distribuida

CERN Organizacioacuten Europea para la Investigacioacuten Nuclear

World-Wide-Web (abreviado `Web escrito

tambieacuten `WWW o incluso `W3) significa algo

asiacute como `red (o telarantildea) global La

propaganda oficial del CERN lo define como

un sistema hipermedia distribuido En

principioacute se pensoacute como un medio para la

distribucioacuten de la informacioacuten entre equipos

de investigadores geograacuteficamente

dispersos concretamente se dirigiacutea a la

comunidad de fiacutesicos de altas energiacuteas

vinculados al CERN

Se pretendiacutea que los recursos disponibles

en formato electroacutenico que residen en

ordenadores distintos conectados a la red

fuesen accesibles para cada investigador

desde su terminal de forma transparente

y exento de dificultades sin necesidad de

aprender a utilizar varios programas

distintos Ademaacutes deberiacutea posibilitarse el

salto entre elementos de informacioacuten

conexos Los recursos existentes

deberiacutean integrarse en una red

hipertextual distribuida gestionada por

ordenadores

Gracias a una diseminacioacuten

relampagueante de tecnologiacuteas y

protocolos el mundo gozoacute de

repente de acceso instantaacuteneo a

cualquier tipo de informacioacuten

Todo esto hace que cambie el

grado de mediacioacuten humana para

obtener acceso a la informacioacuten

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 26: bucear y encontrar en internet

World-Wide-Web (abreviado `Web escrito

tambieacuten `WWW o incluso `W3) significa algo

asiacute como `red (o telarantildea) global La

propaganda oficial del CERN lo define como

un sistema hipermedia distribuido En

principioacute se pensoacute como un medio para la

distribucioacuten de la informacioacuten entre equipos

de investigadores geograacuteficamente

dispersos concretamente se dirigiacutea a la

comunidad de fiacutesicos de altas energiacuteas

vinculados al CERN

Se pretendiacutea que los recursos disponibles

en formato electroacutenico que residen en

ordenadores distintos conectados a la red

fuesen accesibles para cada investigador

desde su terminal de forma transparente

y exento de dificultades sin necesidad de

aprender a utilizar varios programas

distintos Ademaacutes deberiacutea posibilitarse el

salto entre elementos de informacioacuten

conexos Los recursos existentes

deberiacutean integrarse en una red

hipertextual distribuida gestionada por

ordenadores

Gracias a una diseminacioacuten

relampagueante de tecnologiacuteas y

protocolos el mundo gozoacute de

repente de acceso instantaacuteneo a

cualquier tipo de informacioacuten

Todo esto hace que cambie el

grado de mediacioacuten humana para

obtener acceso a la informacioacuten

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 27: bucear y encontrar en internet

Se pretendiacutea que los recursos disponibles

en formato electroacutenico que residen en

ordenadores distintos conectados a la red

fuesen accesibles para cada investigador

desde su terminal de forma transparente

y exento de dificultades sin necesidad de

aprender a utilizar varios programas

distintos Ademaacutes deberiacutea posibilitarse el

salto entre elementos de informacioacuten

conexos Los recursos existentes

deberiacutean integrarse en una red

hipertextual distribuida gestionada por

ordenadores

Gracias a una diseminacioacuten

relampagueante de tecnologiacuteas y

protocolos el mundo gozoacute de

repente de acceso instantaacuteneo a

cualquier tipo de informacioacuten

Todo esto hace que cambie el

grado de mediacioacuten humana para

obtener acceso a la informacioacuten

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 28: bucear y encontrar en internet

Gracias a una diseminacioacuten

relampagueante de tecnologiacuteas y

protocolos el mundo gozoacute de

repente de acceso instantaacuteneo a

cualquier tipo de informacioacuten

Todo esto hace que cambie el

grado de mediacioacuten humana para

obtener acceso a la informacioacuten

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 29: bucear y encontrar en internet

la explosioacuten Web

Las primeras instalaciones del WWW para

uso interno del CERN estuvieron listas en

1991 Ese mismo antildeo el sistema se abrioacute ya

a Internet

El eacutexito del WWW el crecimiento de la

telarantildea ha sido espectacular

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 30: bucear y encontrar en internet

queacute era necesario Disentildear e implementar un nuevo protocolo que permitiera realizar

saltos hipertextuales Este protocolo se denomina HTTP (HyperText

Transfer Protocol) y es el lenguaje que hablan los servidores del

WWW

Inventar una lengua para representar hipertextos que incluyera

informacioacuten sobre la estructura y el formato de representacioacuten y

especialmente indicar origen y destino de saltos hipertextuales Este

lenguaje es el HTML o (HyperTextex Markup Language)

Desarrollar aplicaciones cliente (navegadores) para todo tipo de

plataforma y resolver el problema de coacutemo acceder a informacioacuten

que estaacute almacenada y es accesible a traveacutes de protocolos diversos

(FTP HTTPTELNET etc) y representar informacioacuten multiformato

(texto graacuteficos sonidos viacutedeo etc) Netscape Internet Explorer

Mozilla

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 31: bucear y encontrar en internet

quieacuten no conoce estos logos

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 32: bucear y encontrar en internet

pero no son los uacutenicoshellipcomo por ejemplo

Opera browser noruegohellip

Estaacute disponible para Windows Mac OS X GNULinux OS2

Solaris y FreeBSD Ademaacutes hay dos versiones moacuteviles Opera

Mini (moacuteviles sencillos) y Opera Mobile (versiones especiacuteficas y de

pago para teleacutefonos inteligentes y ordenadores de bolsillo) Por

uacuteltimo tambieacuten estaacute presente en las videoconsolas Nintendo DS y

Wii Se ha anunciado igualmente que el navegador estaraacute

disponible para televisores y reproductores DVD

Flock especializado en el suministro de redes sociales y otros

como la Web 20 que trabaja con caracteriacutesticas incluidas en

su interfaz de usuario

El navegador se basa en coacutedigo Firefox de Mozilla

El 22 de julio de 2008 el distribuidor de Linux PC OS anuncioacute

que el navegador Flock sustituiraacute a Firefox como navegador

principal

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 33: bucear y encontrar en internet

las URLs

URL significa Localizador Uniforme de

Recursos es parecido a una direccioacuten

electroacutenica pero contienen informacioacuten

adicional

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 34: bucear y encontrar en internet

Permite que el navegador la encuentre y la

muestre de forma adecuada

Por ello la URL combina el nombre del ordenador

que proporciona la informacioacuten el directorio

donde se encuentra el nombre del fichero y el

protocolo a usar para recuperar los datos

httpeswikipediaorgwikiPortada ftp mail telnet

El formato general de un URL es protocolomaacutequinadirectoriofichero

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 35: bucear y encontrar en internet

los dominios

Un dominio de Internet es un nombre base

que agrupa a un conjunto de equipos o

dispositivos

httpwwwwikipediaorg es un URL wwwwikipediaorg es un nombre de equipo wikipediaorg es un subdominio

Veamos la diferencia entre una URL y un nombre de dominio

Cada nombre de dominio termina en un Dominio de nivel superior que es

siempre o bien uno de una pequentildea lista de nombres geneacutericos (tres o maacutes

caracteres) o un coacutedigo territorial de dos caraacutecteres

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 36: bucear y encontrar en internet

ejemplos de dominios de nivel superior

geograacuteficos

ejemplos de dominios de nivel superior geneacutericos

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 37: bucear y encontrar en internet

Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada Tipos de archivo Extensioacuten utilizada

Access mdb Legacy chp Office Writer ow4

AMIAMI Professional sam Lotus 1-2-3 wku wk1 wk3 wk4 wk5 wk6 Paradox db db3

ANSI Text (7 amp 8 bit) ans txt Lotus Manuscript doc PC-File+ Letter ltr

ASCII Text (7 amp 8 bit) asc txt Lotus Symphony wr1 PDF pdf

Corel Presentations shw Lotus WordPro lwp Personal RBASE rbf

DataEase dba dbm MacWrite II mcw PFSProfessional Plan tid

dBASE dbf MASS11 aa4 aa5aa6aa7aa8 PFSWrite pfb

dBXL dbf Microsoft Multiplan cod col PostScript ps

DEC WPS Plus dx Microsoft PowerPoint ppt Professional Write pw1 pwp

DisplayWrite txt doc Microsoft Project mpp QampA qa qw dtf

Enable 300 wpf ssf Microsoft Rich Text Format rtf QuattroPro wq1 wb1 wb2

First Choice ss fol Microsoft Windows Works dbf Reflex r2d

Flash swf Microsoft Windows Write wri Samna Word sam

FoxBase dbf Microsoft Word doc SmartWare II doc db ws

Framework fw3 Microsoft Works wps wks wdb wcm Sprint spr

Freelance prz pre Microsoft WordPad doc SuperCalc cal

Harvard Graphics cht ch3 Mosaic Twin wku Total Word tw

HTML html htm asp shtml nsf MSG msg Unicode Text txt

IBM FFT fft Microsoft Excel xla xlc xlm xls xlt xlw vCard Electronic Business Card vcf

IBM Revisable Form Text rft MultiMate doc dox fnt fnx Volkswriter 3 amp 4 vw4

IBM Writing Assistant iwa Navy DIF dif VP Planner 3D wks

Ichitaro jtd Nota Bene nb Wang PC (IWP) iwp

JustWrite jw Novell WordPerfect wpd wpg wpf wp5 WordMARC wmc

WordPerfect wp wp5 wpd pln shw wbk wkb wpf

WordStar ws ws2 wsd ws4 ws6

XyWrite xy xy3 xyw Sin olvidar la enorme cantidad de tipos y formatos de archivos

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 38: bucear y encontrar en internet

listos para navegar

El WWW nos ofrece hipertextos nodos de la

telarantildea global Las palabras subrayadas y las

imaacutegenes recuadradas son links que nos

conducen a otros nodos Para viajar hasta ellos

basta situarse con el ratoacuten sobre el link y pulsar

el botoacuten

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 39: bucear y encontrar en internet

de doacutende obtenemos informacioacuten hoyhellip

buscadores el 85 de los internautas comienzan por ahiacute (Michael K

Bergman The Deep Web Surfacing Hidden Value - 2003)

bases de datos

sitios especializados o portales dedicados

revistas cientiacuteficas

sitios integradores

blogs

redes sociales

hellip

una tendencia cumplida

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 40: bucear y encontrar en internet

explosioacuten informativa en la web

Para organizar la masa de informacioacuten se vienen

desarrollando herramientas documentales que

pretenden hacer posible una recuperacioacuten

raacutepida efectiva y eficiente de la informacioacuten

Son sistemas IR conocidos como buscadores

absolutamente imprescindibles a la hora de

movernos por la red

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 41: bucear y encontrar en internet

manejar toda esta informacioacuten resulta imposible y es necesario establecer mecanismos y sistemas que depuren la informacioacuten relevante de la que no lo es

por poner ejemplos obvios y los nuacutemeros cantanhellip

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 42: bucear y encontrar en internet

conociendo la existencia de lo ocultohellip

bull internet visible 25000 millones de paacuteginas 73 millones de paginas diarias se indexan 40 son alcanzadas por los buscadores paacuteginas estaacuteticas

bull internet invisible 550 veces mayor que la web visible paacuteginas generadas en forma dinaacutemica Bases de datos en la

web diferentes tipo de archivos

2Internet en uno que suman 7500 terabytes de informacioacuten

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 43: bucear y encontrar en internet

hasta el infinito y maacutes allaacute

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 44: bucear y encontrar en internet

olas enormes

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 45: bucear y encontrar en internet

alturas infinitas

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 46: bucear y encontrar en internet

asiacute las cosas la te recomienda

cosas que debemos saber

sobre los buscadores

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 47: bucear y encontrar en internet

aprender a buscar

Es necesario definir una estrategia correcta perder

un poco de tiempo y pensar queacute opciones seguir

1 Definir el objetivo y distinguir entre buacutesquedas generales (todo sobre un tema) y una buacutesqueda maacutes concreta (una persona una direccioacuten una paacutegina web un fichero)

2 Pensar queacute sabemos (parte de una direccioacuten el idioma el paiacutes)

3 Extraer palabras clave para expresar la buacutesqueda

4 Escoger el buscador maacutes apropiado y consultar las ayudas para acertar en la forma de expresar la pregunta

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 48: bucear y encontrar en internet

definir claramente iquestQUEacute se busca aprender a formular la pregunta

definir en iquestDOacuteNDE hay que buscar recursos propios de Internet referencia bibliograacutefica recursos full-text

coacutemo empezamoshellip

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 49: bucear y encontrar en internet

buscar es ejecutar una estrategiahellip el eacutexito lleva su tiempo y entrenamiento

1 definir criterios baacutesicos

bull tipo de documento bull tiempo que quiero abarcar bull lengua de recuperacioacuten

2 delimitar estrategia bull definir en una o varias frases cortas el tema bull buscar los conceptos maacutes significativos contenidos en las frases bull buscar sinoacutenimos y teacuterminos alternativos para la lista de conceptos

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 50: bucear y encontrar en internet

los buscadores

2 tipos 2 filosofiacuteas

bull directorios o iacutendices temaacuteticos (buscadores por categoriacuteas)

bull motores de buacutesqueda (buscadores por contenido)

bull La diferencia fundamental es que los iacutendices mantienes su base de datos ldquomanualmenterdquo se estructuran por temas o categoriacuteas

bull Los motores emplean robots de buacutesqueda (spiders) potentes programas que se dedican a recorrer la Web recopilando e indizando todo el texto que encuentran

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 51: bucear y encontrar en internet

La eleccioacuten entre motores y directorios y dentro de cada grupo la inclinacioacuten hacia uno en

concreto debe hacerse conociendo lo que podemos esperar de ellos las posibilidades que nos ofrecen y los servicios de valor antildeadido que

presentan estos sistemas de recuperacioacuten de informacioacuten

directorios versus motores

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 52: bucear y encontrar en internet

Se trata de servicios que analizan una parte limitada de la web (exhaustividad limitada) pero que utilizan equipos de editores humanos que seleccionan los recursos a incluir en su base de datos de acuerdo con criterios bien establecidos y los indizan manualmente (calidad elevada) Los recursos se organizan en forma de aacuterbol jeraacuterquico organizado de acuerdo con unos temassubtemas (categoriacuteassubcategoriacuteas) Esta organizacioacuten facilita el ldquobrowsingrdquo de los usuarios

directorios

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 53: bucear y encontrar en internet

motores

Sus bases de datos se alimentan de lo que los softwares de rastreo los denominados spiders encuentran en su monotorizacioacuten sistemaacutetica de la red De manera automaacutetica van entrando millones de paacuteginas cada diacutea analizan el texto que contienen lo indizan y con ello se construye tambieacuten automaacuteticamente un registro que pasa a incrementar la base de datos

No existe por tanto clasificacioacuten jeraacuterquica

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 54: bucear y encontrar en internet

metabuscadores

Los metabuscadores permiten realizar preguntas desde una uacutenica pantalla una buacutesqueda y lanzarla al mismo tiempo contra muacuteltiples motores (Lycos Infoseek Excite Altavista etc)

No buscan por siacute mismos se limitan a pedir a otros que busquen por eacutel lo que permite buscar en varios buscadores al mismo tiempo

Comparan los enlaces devueltos para evitar repeticiones y colocaraacuten primero los maacutes repetidos ya que se consideran maacutes importantes al estar dados de alta en maacutes buscadores

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 55: bucear y encontrar en internet

El teacutermino metabuscador o megabuscador o tambieacuten metaengine megasearcher parallel search engine multiple search engine etc designa interfaces en las que se pueden usar varios motores de buacutesqueda al mismo tiempo

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 56: bucear y encontrar en internet

es un metabuscador que interroga filtra y ordena

resultados de otros buscadores Desde su servicio de

buacutesqueda avanzada podremos obtener los diferentes

buscadores con los que trabaja Su caracteriacutestica maacutes

resentildeable como metabuscador es su capacidad para

estructurar y agrupar los resultados por categoriacuteas

temaacuteticas o clustering

Otro detalle destacable es que realiza buacutesquedas en la

Wikipedia una enciclopedia universal de acceso libre

aunque Clusty soacutelo tiene en cuenta su edicioacuten en

ingleacutes

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 57: bucear y encontrar en internet

Kartoo est un meacutetamoteur de recherche qui preacutesente ses

reacutesultats sous la forme dune carte

Degraves que vous avez lanceacute votre requecircte Kartoo lanalyse

interroge les moteurs de recherche les plus pertinents

seacutelectionne pour vous les sites concerneacutes et vous les livre sous

la forme dune carte

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 58: bucear y encontrar en internet

en cualquier caso hay que tener en cuenta las limitaciones

bull Las posibilidades de buacutesqueda son siempre limitadas y diversas debemos conocerlas (suelen estar explicadas en el link ldquoBuacutesqueda avanzadardquo ldquoAyudardquo ldquolo que hay que saberrdquo)

bull Los recursos que el sistema devuelve estaacuten ordenados de acuerdo con un criterio de relevancia no siempre claro conocer la forma y la estructura del ranking es fundamental

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 59: bucear y encontrar en internet

siempre teniendo presente que

Los buscadores NO VEN toda la web su visioacuten es muy limitada

Los buscadores SOacuteLO indizan una parte de la web de acuerdo con un criterio de exclusioacuten

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 60: bucear y encontrar en internet

desarrollo de nuevas capacidades

3 liacuteneas claras de investigacioacuten

bull Aumento de la facilidad de uso Buacutesqueda en LN extensioacuten semaacutentica (sinoacutenimos errores)

traduccioacuten

bull Aumento de la potencia de buacutesqueda Facilitadores de buacutesquedas (agentes) metabuscadores

bull Mejora de los criterios de relevancia

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 61: bucear y encontrar en internet

se impuso desde el principio no soacutelo por

la relevancia de los resultados ofrecidos

como buscador sino tambieacuten por su

disentildeo austero y simplicidad de uso

1995 la fecha

Sergey Brin Larry Page los

nombres

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 62: bucear y encontrar en internet

Noticias

Google se distancia de la competencia [03-06-02] Seguacuten un nuevo estudio realizado por Onestat durante el mes de mayo Google

vuelve a ser el buscador preferido por los internautas y ampliacutea la distancia

respecto a sus competidores Los resultados expresados en porcentaje son

Google (5107) Yahoo (1988) MSN Search (843) Terra Lycos (434)

Altavista (381) Ixquick (234) y AOL Search (218) Otros resultado

interesante es el crecimiento de Teoma (08)

una tendencia reconocida

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 63: bucear y encontrar en internet

el comienzo y curiosidades bull Alumnos de la universidad de Stanford comienzan a trabajar en el ldquoDigital Library Projectrdquo en

un algoritmo de buacutesqueda de datos que posteriormente seriacutea la base de Google bull En enero de 1996 comienzan el trabajo en su buscador al que llaman BackRub Un antildeo

despueacutes este buscador ya teniacutea indexadas 24 millones de paacuteginas

bull Google viene de Googol que es como originariamente debiacutea haberse llamado El Googol es un nuacutemero matemaacutetico el 1 seguido de 100 ceros que no tiene ninguna utilidad relevante pero al representar una cantidad tan alta fue el elegido por Larry y Sergey El nombre a este nuacutemero fue dado por el matemaacutetico estadounidense Edward Kasner que le pidioacute a su sobrino que inventase un nombre para un nuacutemero muy grande El libro aparecioacute en 1938 bajo el tiacutetulo ldquoLas matemaacuteticas y la imaginacioacutenrdquo

bull Cuando se fue a registrar el nombre para el buscador un error tipograacutefico hizo que se

registrase Google en lugar de Googol algo que a la larga ha salido bien ya que Googol era un dominio que ya estaba comprado

bull Aunque si nos pusieacutesemos extremadamente escrupulosos habriacutea que decir que ya existiacutea un

Google antes de que el sobrino de Edward Kasner bautizase asiacute a un nuacutemero y posteriormente un error tipograacutefico le diese nombre a un buscador de internet Pues al parecer el Google es un horrible monstruo que vive en un lejano paiacutes seguacuten The Google Book un libro para nintildeos escrito en 1913

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 64: bucear y encontrar en internet

hoy por

hoy

una industria ramificada

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 65: bucear y encontrar en internet

servicio de correo electroacutenico con posibilidades POP3 e IMAP gratuito disponible a

partir del 15 de abril de 2004 y que ha captado la atencioacuten de los medios de

informacioacuten por sus innovaciones tecnoloacutegicas su capacidad y por algunas noticias

que alertaban sobre la violacioacuten de la privacidad de los usuarios

el 7 de julio de 2009 el servicio de Gmail junto con Google Calendar Google Docs

y Google Talk dejaron su calidad de Beta y pasaron a ser productos terminados

ofrece una capacidad de almacenamiento de maacutes de 7 GB en aumento Actualmente

la tasa de crecimiento es de aproximadamente 4 bytes por segundo hellip

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 66: bucear y encontrar en internet

Google Docs y Hojas de caacutelculo oficialmente Google Docs amp

Spreadsheets es un programa gratuito basado en Web para crear

documentos en liacutenea con la posibilidad de colaborar en grupo

Incluye un Procesador de textos una Hoja de caacutelculo Programa

de presentacioacuten baacutesico y un editor de formularios destinados a

encuestas

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 67: bucear y encontrar en internet

Tambieacuten es famoso su programa Google Earth mapamundi en 3D

con imaacutegenes de alta resolucioacuten combinando imaacutegenes de sateacutelite

mapas y el motor de buacutesqueda de Google

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 68: bucear y encontrar en internet

34 compantildeiacuteas apoyan Android pero los primeros

terminales no apareceraacuten hasta mediados de 2008

El Paiacutes Madrid - 05112007

Google crea la

primera

plataforma de

coacutedigo abierto

para la

telefoniacutea moacutevil

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 69: bucear y encontrar en internet

En septiembre de 2008 lanzan un

navegadorhelliprdquoreiventando la ruedardquo

desde acuerdos con Mozilla

compitiendo con MS IExplorerhellip

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 70: bucear y encontrar en internet

y maacuteshellip

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 71: bucear y encontrar en internet

en constante desarrollohellip

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 72: bucear y encontrar en internet

que cotiza en bolsa

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 73: bucear y encontrar en internet

con la que estaacute cayendohellip

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 74: bucear y encontrar en internet

PageRank

el secreto estaacute en el ranking

Es el nuacutecleo del software de Google un sistema de clasificacioacuten de paacuteginas

Basado en la extensa estructura de viacutenculos de la web como indicador del valor de una paacutegina individual intrepreta un link desde A a B como un voto de la paacutegina A a la paacutegina B

Revisa ademaacutes del nuacutemero de links que una paacutegina recibe la paacutegina que emite el voto Los votos emitidos por paacuteginas en siacute mismas ldquoimportantesrdquo pesan maacutes

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 75: bucear y encontrar en internet

Google

bull Mantiene todas las ventajas de un robot de

buacutesqueda automaacutetica (consigue rastreos muy

amplios) pero intenta eliminar el problema de

informacioacuten de baja calidad

bull Aplica como criterio principal para ordenar los

resultados el criterio de cita bibliograacutefica y no el

nuacutemero de veces que una palabra clave se

repite en una paacutegina (por ejemplo)

bull Su algoritmo mide 200 variables que cambian constantemente para clasificar la informacioacuten

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 76: bucear y encontrar en internet

Son los propios usuarios de internet

mediante sus particulares selecciones de

paacuteginas favoritas en cada momento

quienes determinan el orden en que

apareceraacuten los resultados al realizar una

buacutesqueda

En teoriacutea los resultados de este buscador son siempre de

calidad y actuales

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 77: bucear y encontrar en internet

buacutesqueda avanzada en Google

se trata de establecer filtroshelliptodos los que creas oportunos

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 78: bucear y encontrar en internet

tiene capacidad para localizar una gran variedad de

documentos en diferentes formatos A modo de ejemplo

podemos realizar una consulta de contenidos que

contengan la palabra ldquogerontologiacuteardquoen formato ppt

(presentacioacuten Power) y en dominios es

El formulario de buacutesqueda avanzada en Google soacutelo

permite restringir las pesquisas a unos pocos formatos

Es recomendable realizar la consulta desde la paacutegina

inicial escribiendo en la caja de buacutesqueda mediante la

sentencia filetype y el formato de archivo

correspondiente obtendremos los resultados deseados

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 79: bucear y encontrar en internet

se trata de establecer filtroshelliptodos los que creas oportunos

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 80: bucear y encontrar en internet

o buscar de forma raacutepida definicioneshellip

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 81: bucear y encontrar en internet

Un directorio de

direcciones de

sitios web

donde miles de

usuarios hacen

de editores

clasificando y

manteniendo

actualizadas las

direcciones y

descripciones

del mismo

Colaboran de

forma

desinteresada

maacutes de 46000

personas de

todo el mundo y

hay clasificados

maacutes de 3

millones de

sitios web

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 82: bucear y encontrar en internet

Open Archives Initiative httpwwwopenarchivesorg

Tiene como objetivo cambiar el modelo de comunicacioacuten cientiacutefica

poniendo en Internet a libre disposicioacuten la produccioacuten acadeacutemica

que se genera en las diferentes universidades y organismos de

investigacioacuten de todo el mundo

Es una alternativa o complemento al sistema tradicional de

comunicacioacuten cientiacutefica que gira alrededor de las grandes editoriales

comerciales y pretende recuperar la tradicioacuten de los cientiacuteficos de

publicar sus trabajos en entornos que posibiliten la visibilidad e

intercambio con los colegas para mejorar la investigacioacuten

progreso y difusioacuten del conocimiento

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 83: bucear y encontrar en internet

Budapest Open Access Initiative

En diciembre de 2001 la Open Society Istitute (OSI) celebroacute una reunioacuten donde se

acordoacute una declaracioacuten firmada por maacutes de 300 instituciones internacionales donde

se promueven dos estrategias para hacer frente a los retos de la publicacioacuten

cientiacutefica y encontrar canales abiertos de comunicacioacuten la creacioacuten de repositorios

institucionales e impulsar las publicaciones especializadas de acceso abierto

Ejemplos

bull PLos acceso libre a revistas de fiacutesica y medicina

bull PubMed Central

bull BioMed Central

bull DOAJ revistas centificas y acadeacutemicas de la mayoriacutea de las especialidades

bull CogPrints psicologiacutea

bull SciELO Scientific Electronic Library Online (Ameacuterica latina Espantildea y Portugal)

bull Revicen Red de Reviacutestas Cientiacuteficas Espantildeolas

bull e-revistas de Tecnociencia

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 84: bucear y encontrar en internet

icono de Google books

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 85: bucear y encontrar en internet

La Blogosfera es una gran

globo bien inflado pero un

globo

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 86: bucear y encontrar en internet

linkesfera de la blogesfera

blogger blogging blogia blogalia

bloglines webblog bitaacutecorahellip

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 87: bucear y encontrar en internet

por no seguir hablandohellip

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 88: bucear y encontrar en internet

hay soluciones para todo hellip o casi todo

No abandoneshellip

tambieacuten en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 89: bucear y encontrar en internet

Deteccioacuten de errores

Servicio de traduccioacuten

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 90: bucear y encontrar en internet

definiciones en Google Se trata de buscar definiciones de palabras una caracteriacutestica que se ha apoyado en la tecnologiacutea bdquoGlossary‟ desarrollada en el laboratorio bdquoGoogle Labs‟

De esta manera si buscamos por ejemplo bdquodefineinternet‟ nos encontraremos con

la definicioacuten que Google hace de la palabra bdquointernet‟

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 91: bucear y encontrar en internet

Maacutes

Servicio de respuestas

personalizadas

Se tata de un servicio pago a traveacutes

del cual los ldquoclientesrdquo del buscador

pueden lanzar una pregunta a un

grupo de expertos

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 92: bucear y encontrar en internet

si buscas imaacutegenes y tienes problemas con los idiomashellip

realmente tienes un problema

multibuscador

porque lengua se revela como el elemento clave El proyecto de la Universidad de Washington es interesante porque se trata de ofrecer un traductor de palabras para lanzar a posteriori la buacutesqueda de las imaacutegenes deseadas

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 93: bucear y encontrar en internet

El proceso es el siguiente se inscribe en el formulario de buacutesqueda la palabra clave a

buscar el buscador ofrece un listado de diferentes idiomas con la

traduccioacuten de la palabra propuesta si la palabra seleccionada es ambigua Panimages propone

opciones para determinar el sentido correcto que deseamos en nuestra pesquisa

en la presentacioacuten de resultados facilita un listado de idiomas seleccionables encabezado por el que ofrece mayor nuacutemero de respuestas

la presentacioacuten de resultados es a doble ventana Flickr a la izquierda y Google a la derecha

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 94: bucear y encontrar en internet

He filtrado por tamantildeo aunque tengo que entrar para ldquover imagen en tamantildeo

completordquohellipy conocer de queacute dimensiones hablamos en cada caso

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 95: bucear y encontrar en internet

si el tamantildeo es lo que importahellipGoogle Image Ripper (en desarrollo)

permite acotar la buacutesqueda seguacuten el tamantildeo de las imaacutegenes (iconos pequentildeas medianas grandes extragrandes y supergrandes)

Los resultados nos devuelven las imaacutegenes en el tamantildeo original

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 96: bucear y encontrar en internet

Un nuevo producto de Google que permite personalizar al maacuteximo

todos los recursos de este potente buscador Se trata de Google Co-op que permite confeccionar un motor de buacutesqueda en funcioacuten de los contenidos que eacutestos previamente hayan seleccionado

Podemos elaborar un buscador que se ajuste a nuestros intereses un buscador temaacutetico o un motor

de buacutesqueda circunscrito a un soacutelo dominio

buscadores a medidahellip

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 97: bucear y encontrar en internet

Como ejemplo en unos minutos hemos creado un buscador Biblionews un buscador exclusivo de noticias sobre archivos y bibliotecas Aunque no lo notes dispone del mismo sistema de buacutesqueda avanzada del propio Google asiacute que podemos acotar las buacutesquedas por tipo de archivo por tiacutetulo contenido url o restringir nuestras buacutesquedas a un uacutenico dominio Un producto muy recomendable

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 98: bucear y encontrar en internet

la competenciahellip intentan reemplazar a Google atacando sus ldquodefectosrdquo algunos mejoran la relevancia de resultados de la buacutesqueda otros mejoran la clasificacioacutenhellip

ejemplos son

- Teoma Propiedad de la compantildeiacutea Ask Jeeves Inc

- WiseNut Propiedad de la empresa LookSmart Maacutes 1500 millones de

paacuteginas en su Base de Datos

- AllTheWeb Utiliza la tecnologiacutea de la compantildeiacutea noruega Fast Maacutes de 2 mil

millones de paacuteginas indexadas Tambieacuten busca imaacutegenes ficheros MP3 y

noticias

- Gigablast Proyecto personal de Matt Wells Maacutes de 150 millones de

paacuteginas indexadas

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 99: bucear y encontrar en internet

un mercado en constante movimiento y ademaacutes en guerrahellip Yahoo ha superado a Google en iacutendices de satisfaccioacuten Los resultados de la encuesta de Satisfaccioacuten de Clientes Americanos de la Universidad de Michigan

pone a Yahoo por encima de Google en el 2007

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 100: bucear y encontrar en internet

Scirus buscador especiacutefico de informacioacuten cientiacutefica

por cierto podemos optar por buscadores especializadoshellip

productor de la base de datos ScienceDirect

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 101: bucear y encontrar en internet

buacute

sq

ue

da

ava

nza

da

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 102: bucear y encontrar en internet

Todo esto hay que tenerlo en cuenta ya que Google a

pesar de tener la mayor base de datos de paacuteginas en la

web y de poseer una relevancia adecuada sufre de un

defecto grave sigue devolviendo demasiados resultados y

por tanto es difiacutecil clasificar la informacioacuten

una nueva generacioacuten de motores que

pretende resolver este problema

todo un oceacuteano de opciones

abiertas para estudiarhellip

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 103: bucear y encontrar en internet

por ciertohellipquieacuten haya comprado

un ordenador con hellip

se encontraraacute con

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 104: bucear y encontrar en internet

el mundo de los buscadores no es paciacuteficohellip

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 105: bucear y encontrar en internet

la web semaacutentica

Web extendida

y maacuteshellip

httpwwww3ces

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 106: bucear y encontrar en internet

bull ldquoDotada de mayor significado en la que cualquier usuario en Internet podraacute encontrar respuestas a sus preguntas de forma maacutes raacutepida y sencilla gracias a una informacioacuten mejor definida Al dotar a la Web de maacutes significado y por lo tanto de maacutes semaacutentica se pueden obtener soluciones a problemas habituales en la buacutesqueda de informacioacuten gracias a la utilizacioacuten de una infraestructura comuacuten mediante la cual es posible compartir procesar y transferir informacioacuten de forma sencilla Esta Web extendida y basada en el significado se apoya en lenguajes universales que resuelven los problemas ocasionados por una Web carente de semaacutentica en la que en ocasiones el acceso a la informacioacuten se convierte en una tarea difiacutecil y frustrante

si tenemos curiosidad httpwwww3cesDivulgacionGuiasbrevesWebSemantica

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 107: bucear y encontrar en internet

El teacutermino Web 20 fue acuntildeado por Tim OReilly en 2004

para referirse a una segunda generacioacuten en la historia de

la Web basada en comunidades de usuarios y una gama

especial de servicios como las redes sociales los blogs

los wikis o las folcsonomiacuteas que fomentan la colaboracioacuten

y el intercambio aacutegil de informacioacuten entre los usuarios

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 108: bucear y encontrar en internet

A globally linked database

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 109: bucear y encontrar en internet

Internet al borde del colapso La red podriacutea llegar al liacutemite de su capacidad

todos hemos leiacutedo previsiones de un futuro incierto del tipo

ldquoInternet podriacutea colapsar Y eso seriacutea antes de que

termine 2007rdquo

Las razones son bastantes sencillas seguacuten las

principales consultoras como Deloitte Consulting el

crecimiento del nuacutemero de usuarios y de dispositivos

de acceso a la red estaacuten poniendo al liacutemite su

capacidadrdquo

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 110: bucear y encontrar en internet

YouTube estaacute sirviendo al diacutea 40 millones de

viacutedeos lo que supone unos 200 terabytes de

datos es decir aproximadamente 200000

gigashellip

maacutes de un tercio de todo el traacutefico de internet son

aplicaciones de viacutedeo y audio que consumen

mucho ancho de banda Los nuevos protocolos

de viacutedeo y voz requieren cada vez maacutes calidad y

maacutes ancho de banda

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 111: bucear y encontrar en internet

htt

p

ww

winte

rnet2

edu

buscando nuevos paradigmashellip In

tern

et2

(I2

) (u

niv

ers

idades a

mericanas)

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 112: bucear y encontrar en internet

GEacuteANT es la red de Investigacioacuten

pan-Europea de alta velocidad

maacutes de 3000 centros de investigacioacuten de

32 paiacuteses

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 113: bucear y encontrar en internet

htt

p

ww

wg

eant

net

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 114: bucear y encontrar en internet

ldquoRedIRIS estaacute en la eacutelite de la red europea Geacuteant 2rdquo

httpwwwelpaiscomarticuloCiberpaisRedIRISeliteredeuropeaGeantelpportec20050519elpcib_8Tes

httpwwwceseandcicaesmodulesphpname=Newsampfile=articleampsid=1538

ldquoA los cientiacuteficos hace tiempo que se les quedoacute pequentildea la Internet

que inventaron y que utiliza el comuacuten de los mortales Por eso desde

mediados de la deacutecada de 1990 el mundo acadeacutemico ha desarrollado

sus propias redes de comunicacioacuten una especie de Internet paralela

Los americanos la llaman Internet 2 y estaacute varios antildeos por delante de

la actual Internet comercial En Europa recibe el nombre de GEacuteANT y

en junio se presenta su la versioacuten renovadardquo (El Paiacutes 19052005)

Disponible en

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 115: bucear y encontrar en internet

htt

p

ww

wg

ea

nt2

ne

t

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes

Page 116: bucear y encontrar en internet

universidad de jaeacuten

vicerrectorado de extensioacuten universitaria

biblioteca infobibujaenes