73
La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

Embed Size (px)

Citation preview

Page 1: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

La Web SemánticaC + C

Claudio Gutierrez / Carlos Hurtado

Centro de Investigación de la Web

Departamento de Ciencias de la Computación

Universidad de Chile

Page 2: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

2

Contenido

• Motivación de la Web Semántica• Web de datos / objetos

– HTML / XML• Web de información / relaciones

- RDF• Web de conocimiento / razonamiento

– OWL• Aplicaciones • Conclusiones

Page 3: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

3

Contenido

• Motivación de la Web Semántica• Web de datos / objetos

– HTML / XML• Web de información / relaciones

- RDF• Web de Conocimiento / Razonamiento

– OWL• Aplicaciones • Conclusiones

Page 4: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

4

La Web: 1989"HyperText and CERN“ Tim Berners-Lee

Page 5: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

5

¿Qué es la Web?

• Una gran base de datos distribuída• Una gigantesca red de comunicaciones• Una biblioteca (casi) infinita• Un foro virtual mundial• Un ejemplo de cerebro artificial• Un buen ejemplo de grafo complejo• Una oportunidad de negocios• Un paraíso del ocio • . . .• Una buena aplicacion computacional

Page 6: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

6

Seamos serios: ¿Qué es realmente la Web?

La (no una) expresión de la interoperabilidad de la información y el conocimiento a nivel mundial

Todas las anteriores (y miles de otras) son triviales consecuencias y corolarios de este hecho fundamental

(Entre nosotros: ¡estamos en un área privilegiada!)

Page 7: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

7

Dato, información y conocimiento

• Dato: información que incluye aspectos útiles y también irrelevantes y debe ser procesado para darle sentido.

• Información: Conocimiento obtenido de la investigación, estudio o instrucción y expresado en algún lenguaje.

• Conocimiento: cuerpo organizado de información. Afirmaciones probadas como verdaderas.

Page 8: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

8

La Web Semántica

"The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation." Tim Berners-Lee, James Hendler, Ora Lassila,

The Semantic Web, Scientific American, Mayo 2001

Page 9: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

9

Contenido

• Motivación de la Web Semántica• Web de datos / objetos

– HTML / XML• Web de información / relaciones

- RDF• Web de conocimiento / razonamiento

– OWL• Aplicaciones • Conclusiones

Page 10: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

10

Web de datos: HTML

<h1> Bibliography </h1><p> <i> Foundations of Databases </i> Abiteboul, Hull, Vianu <br> Addison Wesley, 1995<p> <i> Data on the Web </i> Abiteoul, Buneman, Suciu <br> Morgan Kaufmann, 1999

¡lenguaje de terror!...pero todos tenemos alguna virtud:

Page 11: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

11

Web de datos: HTML

HTML es fácil de usar, fácil de usar, fácil de usar,... y robusto.

Page 12: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

12

HTML es limitado

• Orientado a visualización de datos

• No permite describir datos

• No es extensible: congela pequeños pedazos de etiquetas

• No describe “contenido” (objetos)

Page 13: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

13

Web de datos: XML

<?xml version=“1.0” encoding=“ISO-8859-1”?>

<curso> <profesor> Claudio Gutierrez </profesor> <nombre> Bases de Datos </nombre> <semestre anho=“2005”> Primavera </semestre> <horario>

<modulo tipo=“catedra”> 2.1 </modulo>

<modulo tipo=“catedra”> 3.1 </modulo>

<modulo tipo=“auxiliar”> 1.5 </modulo>

</horario>

</curso>

Page 14: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

14

Web de datos: XML

• Posibilidad de crear nuevos vocabularios• Universalidad via espacios de nombres• Modularidad via espacios de nombres y tipos de

datos• Versatilidad via datos semi-estructurados• Sólidos fundamentos via SGML• Amplio soporte y distribución• Estándar de interoperabilidad documental

Page 15: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

15

Web de datos: consulta

Pediatras de Santiago que atiendan

por Fonasa

Pediatras de Santiago queatiendanporFonasa

Page 16: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

16

                            

         

            

          Chile

La Web    Imágenes    Grupos    Directorio    Noticias¡Nuevo!    

Pediatras Santiago Fonasa

  Búsqueda Avanzada  Preferencias  Herramientas del idioma

Búsqueda: la Web páginas en españolpáginas de Chile

Publicidad - Todo acerca de Google - Google.com in English ¡Haga de Google su página inicial!

©2005 Google - Buscando 8.058.044.651 páginas web

Page 17: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

17

 La Web  Resultados 1 - 10 de aproximadamente 70 de Pediatras Santiago Fonasa. (0,35 segundos) 

Historia (Santiago) - CIENCIA POL ICA E HISTORIA: EDUARDO CRUZ ... ... se han incorporado al sistema público de FONASA. ... edición, 1936-1986, Empresa Periodística de Chile, Santiago. ... sus ayudantes y de algunos pediatras, como el ... www.scielo.cl/ scielo.php?pid=S0717-71942002003500007&script=sci_arttext&tlng=es - 101k - 15 Ene 2005 - En caché - Páginas similares

[PDF] CUENTA DEL DIRECTORIO DE LA SOCIEDAD CHILENA DE ENFERMEDADES ... Formato de archivo: PDF/Adobe Acrobat - Versión en HTML... de Otoño se realizó en Santiago, en el Centro ... de médicos de adultos y pediatras de distintos ... del trasplante de pulmón (solicitud de codificación FONASA). ... www.scielo.cl/pdf/rcher/v18n4/art06.pdf - Páginas similares[ Más resultados de www.scielo.cl ]

COLEGIO DE CIRUJANO DENTISTAS DE CHILE ... por un equipo multiprofesional que incluyó pediatras, dermatólogos y ... en el diario, el director de Fonasa Álvaro Erazo ... Arturo López Pérez de Santiago y el ... www.colegiodentistas.cl/modules.php?op=modload& name=Sections&file=index&req=printpage&art... - 27k - En caché - Páginas similares

[PDF] Informe N 222 Formato de archivo: PDF/Adobe Acrobat - Versión en HTML... Lagos en visita al Hospital Salvador de Santiago, 10 de ... A FONASA le afecta menos, pues su ingreso por ... En este momento UNICEF Chile, junto a pediatras y grupos ... www.asuntospublicos.org/descargaPDF. php?id=222&url=222.pdf - Páginas similares

Analisis On Line ... o de familia, ginecólogos y pediatras, puede llegar ... propios médicos en convenio con el Fonasa o las ... Integramédica Merced 360, Piso 6 Santiago - Fono 6366944 ... www.saludyfuturo.cl/pags/online/cont_pag15.htm - 25k - En caché - Páginas similares

SAVALnet ... cirujanos plásticos, dermatólogos y pediatras, así como ... Fondo Nacional de Salud (Fonasa), doctor Patricio ... de Rehabilitación de Santiago, dependencias que ... www.saval.cl/link.cgi/SavalNet/Noticias/3123 - 62k - En caché - Páginas similares

Page 18: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

18

Seamos serios: nos merecemos algo más...

Page 19: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

19

Contenido

• Motivación de la Web Semántica• Web de datos / objetos

– HTML / XML• Web de información / relaciones

- RDF• Web de conocimiento / razonamiento

– OWL• Aplicaciones • Conclusiones

Page 20: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

20

Web de datos vs. información

Page 21: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

21

Web de información

Page 22: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

22

Modelo de datos I: Requerimientos

1. Todo es un recurso: páginas web, bases de datos, ampolleta del patio, dirección de la empresa, etc.

2. Identificadores únicos: cada recurso tiene un único identificador

3. Vocabularios compartidos: predicados deben ser comunes para todos en un área

4. Estructura extensible y distribuída: todos pueden agregar su información y nadie debe ser dueño de toda

Page 23: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

23

Modelo de datos: XML no es suficiente

<?xml version=“1.0” encoding=“ISO-8859-1”?>

<rukangma> <chaw> Aukan </chaw>

<nguke> Peyeche </nguke> <yall>

<pichi s=“wentru”> mari </pichi>

<pichi s=“wentru”> epu </pichi>

<pichi tipo=“domo”> regle </pichi>

</yall>

</rukangma>

Page 24: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

24

Modelo de datos: XML no es suficiente

• Modelo es un árbol (no un grafo)• Hijos están ordenados• Esquemas no permiten extensibilidad distribuída

pero sobretodo:

XML modela documentos, y el mundo real no es un documento, sino una red de relaciones

(aunque no olvidemos que hay muchos documentos)

Page 25: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

25

Modelo de datos II:la solución

Resource Description Framework (RDF)

La información es un grafo dirigido etiquetado que modela las relaciones entre objetos – Nodos: recursos – Arcos: propiedades

Las oraciones tienen de la forma:

objetopredicado

sujeto

Page 26: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

26

Modelo de datos III:propiedades de RDF

– Expresividad: fragmento conjuntivo de la lógica de primer orden

– Complejidad: tratable bajo condiciones “razonables”

– Soporte teórico: modelo de grafos en Bases de Datos, Redes semánticas

,...,),,(,, 21 ccYXp

Page 27: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

27

Web de información: consulta

Pediatras de Santiago que atiendan

por Fonasa

?X

Fonasa

Santiago

Beaucheff

convenio

dirección ciudad

callePediatra

especialidad

Page 28: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

28

Lenguajes de Consulta para la Web Semántica

• (2000) rdfDB: basado en correspondencia de patrones simples.

• (2001) SquishQL: navegación en grafo, variables para nodos en patrones, filtros.– Implementaciones: RDQL, InkLink.

• (2002) RQL: enfoque funcional a la OQL, variables para nodos y arcos en patrones.

• (2003) DQL: considera un grafo RDF como una base de conocimiento.

Page 29: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

29

RDF: Sentencias sobre Sentencias (Reificación)

Page 30: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

30

Sintaxis XML para RDF

Page 31: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

31

Web de información:relaciones entre conceptos

Page 32: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

32

Web de información: Ontologías

• Entendimiento compartido de algún dominio de interés

• Vocabulario aceptado por una comunidad amplia

• Facilitan descripciones, búsqueda semántica y razonamiento

• Similar a esquemas en bases de datos tradicionales pero aceptados globalmente

Page 33: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

33

Ejemplo: Ontología para fuentes naturales de agua

OceanoLago

CuerpoDeAgua

Río

CorrienteDeAgua

Propiedades: largo: Literal desembocaEn: CuerpoDeAgua

Mar

FuenteNaturalDeAgua

TributarioArroyo

Vertiente

Page 34: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

34

Modelo de datos IV: RDF Schema (RDFS)

• Vocabulario para definir Ontologías

• Clases, subclases y propiedades.

(Rio,rdfs:type,rdfs:class)

(Rio,rdfs:subclass,CorrienteDeAgua)

(desembocaEn,rdf:type,rdfs:property)

(desembocaEn,rdf:domain,Rio)

(desembocaEn,rdf:range,CuerpoDeAgua)

Page 35: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

35

Inferencia usando RDFS

OceanoLago

CuerpoDeAgua

Río

CorrienteDeAgua

Propiedades: longitud: Literal desembocaEn: CuerpoDeAgua

Mar

FuenteNaturalDeAgua

TributaryArroyo

Vertiente

(Yangtze,rdfs:type,Río)(Yangtze,longitud,”6300 Km”)(Yangtze,desembocaEn,MarEsteChina)

Inferencia:(Yangtze,rdfs:type,CorrienteDeAgua) (Yangtze,rdf:type,FuenteNaturalDeAgua)(MarEsteChina,rdfs:type,CuerpoDeAgua)

Page 36: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

36

Búsqueda usando una ontología (Shoe)

1. Seleccionar una Ontología “Fuentes naturales de agua”

2. Seleccionar la categoría que mejor describa el tópico de la consulta: “Río”

3. Usar propiedades de la categoría que para restringir la búsqueda

“Longitud > 5000 km & desembocaEn = Lago”

4. Ingresar los términos de la consulta “Yang”

Page 37: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

37

Seamos serios;lo anterior es utopía si no resolvemos:

1. Escalabilidad2. Falta de integridad referencial3. Autoridad distribuída4. Múltiples fuentes5. Diversidad de contenidos6. Uso impredecible de la información ... ...y sobretodo, operar con grafos con muchos nodos

Page 38: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

38

Seamos serios;debemos investigar:

• Grafos que modelen procesos y datos reales (redes complejas)

• Bases de datos de grafos• Interfaces para visualizar grafos• Aplicaciones de marcado a gran escala

Page 39: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

39

Contenido

• Motivación de la Web Semántica• Web de datos / objetos

– HTML / XML• Web de información / metadatos

- RDF• Web de conocimiento / razonamiento

– OWL• Aplicaciones • Conclusiones

Page 40: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

40

Web de Conocimiento

• Razonamiento: Juan Pérez es pediatra, luego atiende niños.

• Prueba: credenciales de Juan Pérez + certificado de actualización + definición de pediatra

• Validación: determinar si Juan Pérez es pediatra, dadas sus credenciales del Colegio Médico + certificado + etc.

Page 41: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

41

Web de Conocimiento

• Web Ontology Language (OWL)– Extiende RDFS para definir/relacionar

ontologías– Posibilita un nivel avanzado de inferencia

para la Web Semántica– Permite:

• definir y restringir clases (conceptos).• definir y restringir propiedades.• definir relaciones entre clases.

Page 42: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

42

OWL

• Características de Propiedades– inverseOf, FunctionalProperty, InverseFunctionalProperty,

TransitiveProperty, SymmetricProperty.• Igualdad/desigualdad:

– equivalentClass, equivalentProperty, sameIndividualAs, differentFrom, allDifferent.

• Definición de Clases: – intersectionOf, unionOf, complementOf.

• Restricciones de Cardinalidad:– minCardinality, maxCardinality, cardinality

• Otros...

Page 43: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

43

Definición de Clases en OWL

• Clase F: “ríos que desembocan en el mar”

OceanoLago

CuerpoDeAgua

Río

CorrienteDeAgua

Propiedades: longitud: Literal desembocaEn: CuerpoDeAgua

Mar

FuenteNaturalDeAgua

TributaryArroyo

Vertiente

Page 44: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

44

Primitivas en OWL para Definir Clases

Page 45: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

45

OWL Full, OWL DL y OWL Lite

OWL Full

OWL DL

OWL Lite

Page 46: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

46

Ontologías: Herramientas

• RDF Instance Creator (RIC)– http://www.mindswap.org/~mhgrove/RIC/RIC.shtml– Limited OWL capabilities

• OilEd:– http://oiled.man.ac.uk/– Editor for ontologies– Mostly for DAML+OIL, exports OWL but not a current representation

• OWL Validator:– http://owl.bbn.com/validator/– Web-based or command-line utility– Performs basic validation of OWL file

• Dumpont:– http://www.daml.org/2001/03/dumpont/– a simple class and hierarchy property viewer, which also works with OWL, e.g.,

• http://www.daml.org/cgi-bin/dumpont?http://www.w3.org/2002/07/owl

• OWL Ontology Validator:– http://phoebus.cs.man.ac.uk:9999/OWL/Validator– a "species validator" that checks use of OWL Lite, OWL DL, and OWL Full constructs

• Euler:– http://www.agfa.com/w3c/euler/– an inference engine which has been used for a lot of the OWL Test Cases

• Chimaera:– http://www.ksl.stanford.edu/software/chimaera/– Ontology evolution environment (diagnostics, merging, light editing)– Mostly for DAML+OIL, being updated to export and inport current OWL

• DAML Tools Page - http://www.daml.org/tools/

Page 47: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

47

Editores de Ontologías: Protégé 2000 (stanford Medical Info)

Page 48: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

48

Seamos serios:

• OWL es una Lógica Descriptiva• Es necesario determinar ámbitos de

aplicabilidad• No es escalable como RDF

Page 49: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

49

Contenido

• Motivación de la Web Semántica• Web de datos / objetos

– HTML / XML• Web de información / relaciones

- RDF• Web de conocimiento / razonamiento

– OWL• Aplicaciones • Conclusiones

Page 50: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

50

Aplicaciones I:Directorios y Catálogos Web

Open Directory Project (www.dmoz.org), catálogo de editores distribuídos

Openguides.org.

guía de editores distribuídos

Page 51: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

51

Aplicaciones II: Dublin Core (dublincore.org)

• Vocabulario liviano para representar metadatos sobre recursos: http://purl.org/dc/elements/1.1/

• Propuesto desde la comunidad de bibliotecología.

• Title, Contributor, Author/Creator, Publisher, Subject, Description, Date, Resource, Format, Resource Identifier, Language, Source, Coverage, Rights.

Page 52: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

52

Aplicaciones II:Dublin Core, Ejemplo

Page 53: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

53

Aplicaciones III: Redes Sociales

• ¿Cómo encontrar personas:– con intereses similares a los de uno?– relacionadas a alguien?– autoridades en un tópico?– etc.

• Redes sociales: – Información personal en la Web semántica.– Enlaces a información personal de personas

conocidas.

Page 54: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

54

Aplicaciones III: Friendo Of A Friend, Brickley & Miller

Michael Souris

foaf:Person

mailto:[email protected]

foaf:name

foaf:mbox

Donald Canard

foaf:Person

rdf:type

mailto:[email protected]

foaf:mbox

rdf:type

foaf:name

foaf:knows

Page 55: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

55

Aplicaciones III:FOAF, Ejemplo

<foaf:Person> <foaf:name>Peter Parker</foaf:name><foaf:gender>Male</foaf:gender> <foaf:title>Mr</foaf:title> <foaf:givenname>Peter</foaf:givenname><foaf:family_name>Parker</foaf:family_name> <foaf:homepage

rdf:resource="http://www.peterparker.com"/><foaf:weblog

rdf:resource="http://www.peterparker.com/blog/"/>

</foaf:Person>

Page 56: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

56

Aplicaciones III: Publicación de datos FOAF

• ¿Cómo mis datos FOAF pueden ser conocidos por otros usuarios?– Soy “conocido” por alguien “conocido”:

• Vía “FOAF:knows”

– Publicando mi info en FOAF Bulleting Board: • Sitio con enlaces a decenas de archivos FOAF

– Incluyendo en mi sitio Web un enlace a mi archivo FOAF:

• <link rel="meta" type="application/rdf+xml" title="FOAF" href="foaf.rdf" />

Page 57: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

57

Aplicaciones III:herramientas para FOAF

• FOAF Explorer– Vista HTML de FOAF

• FOAFNaut– Visualización de relaciones entre personas

• Plink– Sitio de redes sociales

• FOAFBot, Whwhwhwh– Interfaces IRC sobre FOAF

Page 58: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

58

Aplicaciones IV:Búsqueda Semántica

• Pediatras que vivan a menos de 10 cuadras de mi casa

• Hoteles 3 estrellas en Viña del Mar que estén cerca del casino

• Carreras del área biología en Universidad de Cauca

• Nombre y dirección postal de profesores de escuelas primarias de Bogotá

Page 59: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

59

Aplicaciones IV:Búsqueda Semántica

(Guha, McCool, Miller)

Page 60: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

60

Aplicaciones V: Consultas Avanzadas

• ¿Cuál es la relación entre dos personas?– Asociaciones semánticas.

• ¿Es esta persona “autoridad” en física teórica?– Ranking de objetos: PageRank, HITS.

• ¿Es válido documento que me envió esta persona?– Inferencia: RDFS, OWL, XML Schema.

Page 61: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

61

Aplicaciones V:Asociaciones Semánticas

(A. Seth, LSDIS, U de Georgia)

• Asociaciones Semánticas:– “relaciones complejas que capturan

conectividad y similaridad de entidades en una base de conocimiento”

Page 62: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

62

Aplicaciones V:Ranking de Asociaciones

• Consulta de asociación entre “Hubwoo” (compañía) y “Soneri” (banco) entrega 1.600 asociaciones en una BD de 800,000 entidades (sistema SWETO @ LSDIS).

• Los resultados deben ser entregados a los usuarios en un orden (Ranking).

Page 63: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

63

Aplicaciones V:Ranking de Asociaciones

• Criterios Semánticos:– Contexto: si el camino pasa por regiones de interés– Especialización: caminos más/menos generales – Confianza: caminos pasan por distintas fuentes de

datos

• Criterios Estadísticos:– Rareza: frecuencia de la asociación– Popularidad: asociaciones que pasan por entidades

muy conectadas en el grafo– Largo: caminos más/menos largos

Page 64: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

64

Web Semántica en la U de Chile

• Aplicaciones– Anuario de Departamentos de Computación

(Depmark)– Integrador de RSS– Sistema Administrador de Servicios Web

Semánticos

• Grupo www.metadatos.cl– Blog, Wiki, – Jueves semánticos

Page 65: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

65

Web Semántica en la U de Chile

• Fundamentos – Bases de datos– Representación del Conocimiento, Lógica– Inteligencia Artificial

• Lenguajes:– ¿Cómo representar la info de la Web

Semántica?– ¿Cómo especificar la Información que

buscamos?

Page 66: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

66

Contenido

• Motivación de la Web Semántica• Web de datos / objetos

– HTML / XML• Web de información / relaciones

- RDF• Web de conocimiento / razonamiento

– OWL• Aplicaciones • Conclusiones / Resumen

Page 67: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

67

Conclusiones• La Web Semántica es un proyecto, no una

religión• No pretende construir otra Web, sino

incorporarle semántica a la única existente• ¡No resolverá todos los problemas de la

humanidad!• Problemas actuales:

– Incorporación de metadatos a gran escala– Automatización de servicios – Modelo de datos de grafos– Escalabilidad– Confianza y seguridad

Page 68: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

68

Web Semántica: Definición Oficial

“The Semantic Web is the representation of data on the World Wide Web. It is a collaborative effort led by W3C with participation from a large number of researchers and industrial partners. It is based on the Resource Description Framework (RDF), which integrates a variety of applications using XML for syntax and URIs for naming.”

http://www.w3.org/2001/sw/

Page 69: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

69

Web Semántica en la Actualidad

Page 70: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

70

Arquitectura de la Web Semántica

Page 71: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

71

Referencias (artículos)

• The Semantic Web, Scientific American, May 2001, Tim Berners-Lee, James Hendler and Ora Lassila

• Listas de artículos en la W3C http://www.w3.org/2001/sw/#pub

• Integrating applications on the Semantic WebJim Hendler, Tim Berners-Lee and Eric Miller, Journal IEE Japan, 122(10):676-680, 2002.

Page 72: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

72

Referencias (opiniones)

• The Semantic Web, Tim Berners-Lee 2002

• W3C list http://www.w3.org/2001/sw/#events

• Aaron Swartz interview January 23 2004 http://iron.wootest.net/aaron_swartz.php

• Eric Miller (W3C semantic web activity lead) talk, early 2004http://www.w3.org/2004/Talks/0120-semweb-umich/slide1-0.html

Page 73: La Web Semántica C + C Claudio Gutierrez / Carlos Hurtado Centro de Investigación de la Web Departamento de Ciencias de la Computación Universidad de Chile

73

Referencias (herramientas)

• Jena – the ‘swiss army knife’ of the semantic web, produced by Hewlett-Pckard Laboratories in Bristol and Palo Altohttp://www.hpl.hp.com/semweb/jena.htmTry the Jena tutorial to get a first introduction to semweb developmenthttp://jena.sourceforge.net/tutorial/RDF_API/index.html

• Protégé – Easy ontology creation, from Stanford Universityhttp://protege.stanford.edu/

• TAP – semantically assisted Google!http://tap.stanford.edu/ Online demo at http://ontap.stanford.edu/sail