View
32
Download
0
Category
Preview:
DESCRIPTION
Sistemas de Búsqueda de Información. Diego Alberto Rincón Yáñez diego-rincon@javeriana.edu.co. Maestria en Ingenieria de Sistemas y Cumputación Pontificia Universidad Javeriana November 2010. Agenda. Conceptualización Casos de Estudio Conclusiones Bibliografía. - PowerPoint PPT Presentation
Citation preview
Sistemas de Búsqueda de Información
Maestria en Ingenieria de Sistemas y CumputaciónPontificia Universidad Javeriana
November 2010
Diego Alberto Rincón Yáñezdiego-rincon@javeriana.edu.co
Agenda
1. Conceptualización
2. Casos de Estudio
3. Conclusiones
4. Bibliografía
CONCEPTUALIZACIÓN
1. Filtros Colaborativos y Sistemas de Recomendación
2. Algoritmos
3. Sistemas Híbridos
4. Software Disponible
Filtro Colaborativo y Sistemas de Recomendación
• Técnicas para filtrar información.• Crea perfiles de usuario.• Están representados por dominios, donde un dominio
equivale a un tema en especifico.• Busca predecir el ranking o peso de una característica.
Métodos de Creación de Perfil de usuario
1. Explicita: Teniendo en cuenta calificadores para las características el usuario le asigna un “peso” con aquellas que ha interactuado.
2. Implícita: Se retroalimenta con la misma interacción del usuario con el sistema sin que este se de cuenta.
Técnicas de Recomendación
• Colaborativa: Acumula recomendaciones de los usuarios y crea relaciones recomendación-usuario.
• Demográfica: Clasifica grupos y recomienda dependiendo el grupo.
• Basada en Contenido: Aprende del perfil usando características jerarquizadas y crean modelos a largo plazo.
• Basada en Utilidad: Compara necesidad del usuario con opciones disponibles en el sistema.
• Basada en Conocimiento: Relaciona ítems – necesidades – usuarios y establece un cruce entre necesidad y recomendación.
Algoritmos de Sistemas de Recomendación
Basados en VecinosMedir los parecidos de todos los usuarios con el
usuario actual.
1) Coeficiente de Relación de Pearson.2) Selección de Vecinos.
Basados en ElementosSeleccionar los elementos votados de un usuario y
comprobar similaridades con el resto de elementos del sistema.
1) Similitudes Basadas en Coseno2) Similitudes Basadas en Coseno Ajustado3) Similitudes Basadas en Correlación4) Calculo de Predicción 5) Suma con Pesos
Predictores Slope – OnePartiendo de Arrays de longitud se toma la información
de los elementos con sus pesos respectivos.
1) Con Pesos2) Bi-Polar
Sistemas Híbridos
Usan características de sistemas basados en contenido y sistemas colaborativos para apoyar la toma de mejores decisiones y obtener mejores recomendaciones.
• Combinación Lineal
• Combinación Secuencial
Software Disponible – Open Source
1. Java1. Taste – Java Beans2. SlopeOne3. La Cofi
2. PHP1. Vogoo2. OpenSlopeOne
3. C#1. Kuber
4. Haskell1. Implementación hecha por Brian Sullivan
5. Erlang1. Implementación hecha por Philip Robinson.
CASOS DE ESTUDIO
•Odyssey-Search, Sistema Multiagente para la búsqueda y recuperación de componentes.
•Framework Multiagente basado en exploración colaborativa para mecanismos de consulta con filtrado basado en términos.
•Agentes ubicuos para el acceso a la información en ambientes nómadas (PUMAS).
Odyssey-Search, Sistema Multiagente para la búsqueda y recuperación de componentes
Universidad de Rio de Janeiro
Flexibilidad
Transparencia
Precisión
Basado meta-data y Ontología
relacionada con el dominio
Odyssey-Search, Sistema Multiagente para la búsqueda y recuperación de componentes
Problema
Las aproximaciones eran basadas en palabras claves, no consideran la semántica y el contexto para la búsqueda y recuperación
Proposición
Proveer un nuevo acercamiento para el acceso a componentes de software por medio de agentes, ontologías, técnicas de inferencia y mediadores
Odyssey-Search, Sistema Multiagente para la búsqueda y recuperación de componentes
Soluciones Técnicas para la recuperación de componentes
1. Usar técnicas de Hipermedia adaptativa, basándose en un modelo (perfiles) pueden decidir como representar la información, teniendo en cuenta.
1. Ajustando el Nivel de Conocimiento, esto agrega mas semántica al proceso.
2. Identificar el nivel de abstracción que el usuario esta buscando (conceptual, arquitectural o implementación).
2. Recolectando meta data de búsquedas anteriores y creando patrones basados en previas experiencias con el tipo de información relevante para el usuario.
3. Usando capa intermedia, donde no necesita preocuparse de la representación de la información (aumenta complejidad cuando hay diferentes formatos de archivo)
4. Aumentando las ontologías de dominio. Algunas veces la búsqueda no es suficiente y se debe incluir otro dominio para obtener información relevante.
• Agente Interfaz
• Interfaz de Usuario adaptativa donde la información se despliega dependiendo de las preferencias capturadas en el modelo.
• Agente de Filtro
• Permite adaptar la información teniendo en cuenta su comportamiento y navegación para filtrar la información del dominio que será desplegada por el AI.
• Agente de Recuperación
• Busca de manera distribuida y heterogénea en los repositorios, teniendo en cuenta la información de búsqueda proporcionada por el AF que a su vez realiza un filtrado y sube a través de las capas
Descripción de Agentes en Odyssey-Search
Arquitectura de Odyssey-Search
Framework Multi-agente basado en exploración colaborativa para mecanismos de consulta con
filtrado basado en términos
Universidad Técnica de Berlín. Alemania
1. Búsqueda por consultas
similares
2. Usar consultas similares
3. Adaptación de consulta actual
Modelo Matemático Cooperación Adaptación Integración con mas Modelos
Contextualización
(U) Usuario
(M) Manejador
(Fn) Filtro Utilizado
1. Definición Atributo : ai es un vector de 2 dimensiones conformado por (vi,wi), donde vi representa su valor y wi representa su importancia.
2. Definición Consulta: Q = Q(ai1, . . . ,aik), serie de atributos k.
Búsqueda por Consultas Similares
Uso de función distancia y función de similaridad
Creación de Consultas Pasadas• Correctamente procesadas• “Suficientemente” similares a la actual
¿Como se calcula “Suficientemente”?
1. Distancia Euclidiana, para medir la distancia entre 2 puntos o entre Q(l) y Q(k). Pero para esta aproximación se comporta de manera opuesta para este problema.
Búsqueda por Consultas Similares
2. Índice de Jaccard
Intercepta las similaridades de 2 consultas dadasLos atributos de los valores son totalmente ignorados
Función de Similaridad Combinada
Tamaño de intercepción absoluta
Garantiza que las intercepciones pequeñas no influyen en el resultado
Usar Consultas Similares
Usan vecindarios para la agrupación de consultas, donde al menos un dato de (vi,wi) aparece en un vecindario
Una colección de atributos (valor – importancia) computados en pares puede describirse como el centroide un vecindario similar a la consulta vecindario
Adaptación de Consulta Actual
Cuando la consulta actual Q(a), tiene un atributo ak el atributo par de esa consulta (vk(a)),wk(a)) se mueve a el resultado esperado (vk(e)),wk(e))
Adaptación de Consulta Actual
Dados los atributos a1, a7 y a8
Tasa de Exploración:
Agentes ubicuos para el acceso a la información en ambientes nómadas
LSR-IMAG Laboratory, Francia
Altamente AdaptableAltamente DistribuidoCooperaciónGenerico
Enrutamiento de Consultas
Interacción entre sistemas de información, usuarios y Dispositivos móviles, teniendo como base un contexto y una meta especifica.
Ejemplo:1.Un paciente genera una alarma debido a un problema de salud2.La alarma le llega a su doctor de cabecera3.El doctor consulta la información en su dispositivo móvil.4.El doctor lanza una consulta de historial medico, que corresponde a:
1. Datos Generales del paciente2. Historia clínica completa3. Tratamiento realizado a el paciente en esa situación4. Causas que generaron la alarma5. Consulta de historial de incidentes similares en historial del
hospital5.El doctor recibe la consulta completa y da un diagnostico.6.El doctor pide asesoría, y el sistema envía el mensaje a doctores
especialistas en el área y devuelven diagnostico.7.El doctor toma una decisión y la envía a el personal que tiene que ver
con el paciente.
Cuadro Comparativo entre casos de Estudio
Odyssey Filtrado de Terminos PUMAS
Adaptación + + +
Distribuido - + +
Cooperación + + +
Modelo Matemático - + -
Enrutamiento de Consultas + - +
Especialización de Agentes + +/- +
Movilidad + - +
Ubiquidad + - +
Pervasividad - - +
+ Aplica- No Aplica+/- Aplica Parcialmente
Conclusiones
• El uso de los Sistemas de Información existentes junto con un sistema adaptativo basado en búsqueda de información, ofrece la posibilidad de brindarle a un usuario un alto porcentaje de obtener la información requerida en un ambiente como conocido.
• La concepción inicial de creación de un sistema adaptativo basado en búsqueda de información se debe centrar en ayudar a el usuario a explorar la información requerida dejando a un lado servicios como la velocidad de respuesta de dicho sistema.
• El diseño de un sistema adaptativo basado en búsqueda de información utilizando SMA busca crear una solución distribuida mejorando un poco ese cuello de botella existente en la velocidad de respuesta.
• Técnicas como Información Retrieval (IR), se pueden implementar junto a un sistema adaptativo basado en búsqueda de información , teniendo en cuenta los principios de cada modelo apoyando en la toma de deciciones uno del otro
¿ PREGUNTAS ?
Referencias
• Sergio Manuel Galán Nieto, Filtrado Colaborativo y Sistemas de Recomendación, Universidad Calos III de Madrid.
• G.Huecas, J Salvachua, Filtros Colaborativos y Sistemas de Recomendacion
• Regina M.M. Braga, Claudia M.L. Werner, Marta Mattoso, Odyssey-Search: A multi-agent system for component information search and retrieval, Computer Science Department, Federal University of Rio de Janeiro, 27 June 2005.
• Lidia Fuentes, Jose M. Troya y Antonio Vallecillo, Desarrollo de Software Basado en Componentes, Universidad de Malaga.
• Sahin Albayrak, Dragan Milosevic, Multi-domain collaborative exploration mechanisms forquery expansion in an agent-based filtering framework, Technical University Berlin, Berlin, Germany, 21 December 2006.
• B. Smyth, P. McClave, Similarity vs. diversity, case-based reasoning research and development, Lecture Notes in Artificial Intelligence2080 (2001) 347–361.
• Angela Carrillo-Ramos, Marlène Villanova-Oliver, Jérome Gensel and Hervé Martin, Knowledge management for adapted information Retrieval in ubiquitous environments, LSR Laboratory,
Recommended