Upload
vito-abrusci
View
117
Download
0
Embed Size (px)
DESCRIPTION
Presentazione del 2010 sullo studio del web semantico.
Citation preview
Il Web dei Dati
Vito, 8/10/10
Cosa ci aspetta
IntroduzioneIl problema
Le potenziali soluzionipratica
introduzione
Ogni linguaggio ha la sua
Sintassi e la sua Semantica
la Sintassi è lo studio della
Grammatica
(come dire qualcosa)
la Semantica rappresenta il
significato
(cosa vogliamo dire)
Sintassi e Semantica
Formano
UNA COMUNICAZIONE
...per esempio
Internet è formata da Computer
connessi via TCP/IP
Il Web da Contenuti Collegati fra
loro e Accessibili via Internet
Le persone
possono, così, facilmente
accedere a questi Contenuti.
Questo è
WEB 1.0
...poi...
gli Sviluppatori hanno iniziato
ad usare Ajax
Le persone hanno iniziato a
pubblicare Foto e Video.
Ad usare RSS ed a «Taggare»
contenuti
A pubblicare pensieri, opinioni e
idee sui Blog
A contribuire sui Wiki
A interagire sui Social Network
E’ nato il Web in
Lettura e Scrittura
Questo è
WEB 2.0
Il Problema
Le pagine sono scritte in HTML
HTML descrive la sintassi ma
non la Semantica
Il software non comprende il
significato dell’informazione.
Quando si riuscirà a far
comprendere il significato ai
Computer
Sarà
WEB 3.0
• Il web è fatto di documenti
• Il web dei dati è fatto di oggetti
E’ possibile riconoscere ruoli, persone, date, prodotti.
Comprendendone le relazioni (?)
Le Soluzioni
(al momento)
Soluzione TOP DOWN:
Analisi dell’informazione, web
scraping, riconoscimento del
linguaggio naturale
E’ Costosa perchè
Richiede Intervento Umano
Difficile da manutenere
Potenziali problemi legali
Soluzione BOTTOM UP:
Aggiungere metadati, ai dati
Il Web dei dati descrive relazioni
Fra cose
Ma come?
Al momento con i formati
RDF, RDFa e Microformats
RDF
Resource Description Format(specifica W3C per descrivere risorse sul Web)
Lo fra tramite URI
le famose Triple
Oggetto - Valore – Proprietà
Soggetto – Predicato - Oggetto
• Rappresentazione Triple e Grafica di un RDF
• Rappresentazione XML e Grafica di un RDF
RDFa
Resource Description Format
a = attributes
(aggiunge gli attributi RDF nell’ XHTML)
Esempio:
Alice pubblica articoli sul suo
blog http://example.com/alice
Dichiara la licenza dei suoi
contenuti
Vuole specificare il titolo e
l’autore di un post
Ma in XHTML non ci sono
attributi simili
Usa il Vocabolario / Dublin Core
Credits di una Foto/ Dublin Core
Vuole mostrare Nome, email e
numero di telefono
E usa FOAF (Friend of a Friend)
Vuole mostrare chi sono i suoi
Amici
...e usa FOAF (Friend of a Friend)
Come estraggo Informazioni ?
Con SPARQL posso interrogare
un «sito» per otterere questi
elementi
Un esempio di Microformat
…alla fine…
Il Web Dei Dati è estensione di
ciò che vediamo oggi
…alla fine…
…risorse…
• W3c
• Rdfa.info
• Microformats.org
• http://www.google.com/webmasters/to
ols/richsnippets
...sparql alla prova
Dataset: http://www.w3.org/People/Berners-Lee/card
http://demo.openlinksw.com/sparql
Query:
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
SELECT ?name
WHERE {
?person foaf:name ?name .
}
...ontologia