Sistemas de Búsqueda de Información

Maestria en Ingenieria de Sistemas y CumputaciónPontificia Universidad Javeriana

November 2010

Diego Alberto Rincón Yáñezdiego-rincon@javeriana.edu.co

Agenda

1. Conceptualización

2. Casos de Estudio

3. Conclusiones

4. Bibliografía

CONCEPTUALIZACIÓN

1. Filtros Colaborativos y Sistemas de Recomendación

2. Algoritmos

3. Sistemas Híbridos

4. Software Disponible

Filtro Colaborativo y Sistemas de Recomendación

• Técnicas para filtrar información.• Crea perfiles de usuario.• Están representados por dominios, donde un dominio

equivale a un tema en especifico.• Busca predecir el ranking o peso de una característica.

Métodos de Creación de Perfil de usuario

1. Explicita: Teniendo en cuenta calificadores para las características el usuario le asigna un “peso” con aquellas que ha interactuado.

2. Implícita: Se retroalimenta con la misma interacción del usuario con el sistema sin que este se de cuenta.

Técnicas de Recomendación

• Colaborativa: Acumula recomendaciones de los usuarios y crea relaciones recomendación-usuario.

• Demográfica: Clasifica grupos y recomienda dependiendo el grupo.

• Basada en Contenido: Aprende del perfil usando características jerarquizadas y crean modelos a largo plazo.

• Basada en Utilidad: Compara necesidad del usuario con opciones disponibles en el sistema.

• Basada en Conocimiento: Relaciona ítems – necesidades – usuarios y establece un cruce entre necesidad y recomendación.

Algoritmos de Sistemas de Recomendación

Basados en VecinosMedir los parecidos de todos los usuarios con el

usuario actual.

1) Coeficiente de Relación de Pearson.2) Selección de Vecinos.

Basados en ElementosSeleccionar los elementos votados de un usuario y

comprobar similaridades con el resto de elementos del sistema.

1) Similitudes Basadas en Coseno2) Similitudes Basadas en Coseno Ajustado3) Similitudes Basadas en Correlación4) Calculo de Predicción 5) Suma con Pesos

Predictores Slope – OnePartiendo de Arrays de longitud se toma la información

de los elementos con sus pesos respectivos.

1) Con Pesos2) Bi-Polar

Sistemas Híbridos

Usan características de sistemas basados en contenido y sistemas colaborativos para apoyar la toma de mejores decisiones y obtener mejores recomendaciones.

• Combinación Lineal

• Combinación Secuencial

Software Disponible – Open Source

1. Java1. Taste – Java Beans2. SlopeOne3. La Cofi

2. PHP1. Vogoo2. OpenSlopeOne

3. C#1. Kuber

4. Haskell1. Implementación hecha por Brian Sullivan

5. Erlang1. Implementación hecha por Philip Robinson.

CASOS DE ESTUDIO

•Odyssey-Search, Sistema Multiagente para la búsqueda y recuperación de componentes.

•Framework Multiagente basado en exploración colaborativa para mecanismos de consulta con filtrado basado en términos.

•Agentes ubicuos para el acceso a la información en ambientes nómadas (PUMAS).

Odyssey-Search, Sistema Multiagente para la búsqueda y recuperación de componentes

Universidad de Rio de Janeiro

Flexibilidad

Transparencia

Precisión

Basado meta-data y Ontología

relacionada con el dominio

Problema

Las aproximaciones eran basadas en palabras claves, no consideran la semántica y el contexto para la búsqueda y recuperación

Proposición

Proveer un nuevo acercamiento para el acceso a componentes de software por medio de agentes, ontologías, técnicas de inferencia y mediadores

Soluciones Técnicas para la recuperación de componentes

1. Usar técnicas de Hipermedia adaptativa, basándose en un modelo (perfiles) pueden decidir como representar la información, teniendo en cuenta.

1. Ajustando el Nivel de Conocimiento, esto agrega mas semántica al proceso.

2. Identificar el nivel de abstracción que el usuario esta buscando (conceptual, arquitectural o implementación).

2. Recolectando meta data de búsquedas anteriores y creando patrones basados en previas experiencias con el tipo de información relevante para el usuario.

3. Usando capa intermedia, donde no necesita preocuparse de la representación de la información (aumenta complejidad cuando hay diferentes formatos de archivo)

4. Aumentando las ontologías de dominio. Algunas veces la búsqueda no es suficiente y se debe incluir otro dominio para obtener información relevante.

• Agente Interfaz

• Interfaz de Usuario adaptativa donde la información se despliega dependiendo de las preferencias capturadas en el modelo.

• Agente de Filtro

• Permite adaptar la información teniendo en cuenta su comportamiento y navegación para filtrar la información del dominio que será desplegada por el AI.

• Agente de Recuperación

• Busca de manera distribuida y heterogénea en los repositorios, teniendo en cuenta la información de búsqueda proporcionada por el AF que a su vez realiza un filtrado y sube a través de las capas

Descripción de Agentes en Odyssey-Search

Arquitectura de Odyssey-Search

Framework Multi-agente basado en exploración colaborativa para mecanismos de consulta con

filtrado basado en términos

Universidad Técnica de Berlín. Alemania

1. Búsqueda por consultas

similares

2. Usar consultas similares

3. Adaptación de consulta actual

Modelo Matemático Cooperación Adaptación Integración con mas Modelos

Contextualización

(U) Usuario

(M) Manejador

(Fn) Filtro Utilizado

1. Definición Atributo : ai es un vector de 2 dimensiones conformado por (vi,wi), donde vi representa su valor y wi representa su importancia.

2. Definición Consulta: Q = Q(ai1, . . . ,aik), serie de atributos k.

Búsqueda por Consultas Similares

Uso de función distancia y función de similaridad

Creación de Consultas Pasadas• Correctamente procesadas• “Suficientemente” similares a la actual

¿Como se calcula “Suficientemente”?

1. Distancia Euclidiana, para medir la distancia entre 2 puntos o entre Q(l) y Q(k). Pero para esta aproximación se comporta de manera opuesta para este problema.

Búsqueda por Consultas Similares

2. Índice de Jaccard

Intercepta las similaridades de 2 consultas dadasLos atributos de los valores son totalmente ignorados

Función de Similaridad Combinada

Tamaño de intercepción absoluta

Garantiza que las intercepciones pequeñas no influyen en el resultado

Usar Consultas Similares

Usan vecindarios para la agrupación de consultas, donde al menos un dato de (vi,wi) aparece en un vecindario

Una colección de atributos (valor – importancia) computados en pares puede describirse como el centroide un vecindario similar a la consulta vecindario

Adaptación de Consulta Actual

Cuando la consulta actual Q(a), tiene un atributo ak el atributo par de esa consulta (vk(a)),wk(a)) se mueve a el resultado esperado (vk(e)),wk(e))

Adaptación de Consulta Actual

Dados los atributos a1, a7 y a8

Tasa de Exploración:

Agentes ubicuos para el acceso a la información en ambientes nómadas

LSR-IMAG Laboratory, Francia

Altamente AdaptableAltamente DistribuidoCooperaciónGenerico

Enrutamiento de Consultas

Interacción entre sistemas de información, usuarios y Dispositivos móviles, teniendo como base un contexto y una meta especifica.

Ejemplo:1.Un paciente genera una alarma debido a un problema de salud2.La alarma le llega a su doctor de cabecera3.El doctor consulta la información en su dispositivo móvil.4.El doctor lanza una consulta de historial medico, que corresponde a:

1. Datos Generales del paciente2. Historia clínica completa3. Tratamiento realizado a el paciente en esa situación4. Causas que generaron la alarma5. Consulta de historial de incidentes similares en historial del

hospital5.El doctor recibe la consulta completa y da un diagnostico.6.El doctor pide asesoría, y el sistema envía el mensaje a doctores

especialistas en el área y devuelven diagnostico.7.El doctor toma una decisión y la envía a el personal que tiene que ver

con el paciente.

Cuadro Comparativo entre casos de Estudio

Odyssey Filtrado de Terminos PUMAS

Adaptación + + +

Distribuido - + +

Cooperación + + +

Modelo Matemático - + -

Enrutamiento de Consultas + - +

Especialización de Agentes + +/- +

Movilidad + - +

Ubiquidad + - +

Pervasividad - - +

+ Aplica- No Aplica+/- Aplica Parcialmente

Conclusiones

• El uso de los Sistemas de Información existentes junto con un sistema adaptativo basado en búsqueda de información, ofrece la posibilidad de brindarle a un usuario un alto porcentaje de obtener la información requerida en un ambiente como conocido.

• La concepción inicial de creación de un sistema adaptativo basado en búsqueda de información se debe centrar en ayudar a el usuario a explorar la información requerida dejando a un lado servicios como la velocidad de respuesta de dicho sistema.

• El diseño de un sistema adaptativo basado en búsqueda de información utilizando SMA busca crear una solución distribuida mejorando un poco ese cuello de botella existente en la velocidad de respuesta.

• Técnicas como Información Retrieval (IR), se pueden implementar junto a un sistema adaptativo basado en búsqueda de información , teniendo en cuenta los principios de cada modelo apoyando en la toma de deciciones uno del otro

¿ PREGUNTAS ?

Referencias

• Sergio Manuel Galán Nieto, Filtrado Colaborativo y Sistemas de Recomendación, Universidad Calos III de Madrid.

• G.Huecas, J Salvachua, Filtros Colaborativos y Sistemas de Recomendacion

• Regina M.M. Braga, Claudia M.L. Werner, Marta Mattoso, Odyssey-Search: A multi-agent system for component information search and retrieval, Computer Science Department, Federal University of Rio de Janeiro, 27 June 2005.

• Lidia Fuentes, Jose M. Troya y Antonio Vallecillo, Desarrollo de Software Basado en Componentes, Universidad de Malaga.

• Sahin Albayrak, Dragan Milosevic, Multi-domain collaborative exploration mechanisms forquery expansion in an agent-based filtering framework, Technical University Berlin, Berlin, Germany, 21 December 2006.

• B. Smyth, P. McClave, Similarity vs. diversity, case-based reasoning research and development, Lecture Notes in Artificial Intelligence2080 (2001) 347–361.

• Angela Carrillo-Ramos, Marlène Villanova-Oliver, Jérome Gensel and Hervé Martin, Knowledge management for adapted information Retrieval in ubiquitous environments, LSR Laboratory,

Sistemas de Búsqueda de Información

Documents

Búsqueda de Información. ¿Qué información necesito encontrar?

Búsqueda de información

BÚSQUEDA ESPECIALIZADA DE INFORMACIÓN

Seminario búsqueda información

Seminario búsqueda de información

Manual búsqueda de información

Búsqueda y selección de información

Búsqueda y manejo de información

Búsqueda de información

Búsqueda información CFGS

Búsqueda información módulo 1

BÚSQUEDA DE INFORMACIÓN CIENTÍFICA

Gestión de la Información: organización, búsqueda y ... personal_EM.pdf · Sistemas de organización de la información 2.2.1. Clasificación decimal universal –CDU– 2.2.2

Búsqueda de información en Project 2010. Nuestra empresa Búsqueda de información en Project 2010

Metodologia Búsqueda Información

Búsqueda y Gestión de Información Científica - …ec3.ugr.es/emilio/Búsqueda y gestión de información científica... · Búsqueda y Gestión de Información Científica Ciencias

Búsqueda de información confiable

Estrategias básicas para búsqueda de información en sistemas automatizados Unidad de Servicios Bibliotecarios Coordinación General del SUBA

2.búsqueda de información

Búsqueda de Información-A_G