Upload
carlo-bidoia
View
204
Download
1
Embed Size (px)
Citation preview
Carlo Bidoia
Insegnante di scienze matematiche fisiche e naturaliOlgiate Comasco, 19/01/15
Tratto liberamente dal lavoro del Dr Karwan Jacksi
Web semantico
1-Internet
• La rete è un sistema globale di calcolatori interconnessi che usa lo standard Internet Protocol Suite (TCP/IP) per servire miliardi di utenti in tutto il mondo.
• È una rete di reti che consiste in milioni di reti pubbliche e private, accademiche, professionali e del governo di estensione da locale a globale che sono legate da un ampia varietà di tecnologie di connessione ottiche ed elettroniche.
Dal seguente articolo:How robust is the Internet?Yuhai TuNature 406, 353-354(27 July 2000)doi:10.1038/35019222
The map was created using the skitter tool (developed by D. McRobb at CAIDA) which sends out small packets of data from a source to many destinations through the Internet. The data collected by skitter give a snapshot of the Internet at a particular moment. (Graph created by B. Huffaker using graph layout code provided by B. Cheswick and H. Burch.)
Memex Conceived
1945
WWWCreated
1989
MosaicCreated
1993
A Mathematical
Theory of Communication
1948
Packet Switching Invented
1964
SiliconChip1958
First Vast ComputerNetwork
Envisioned1962
ARPANET1969
TCP/IPCreated
1972
InternetNamed
and Goes
TCP/IP1984
HypertextInvented
1965
Age ofeCommerce
Begins1995
Un breve sommario dell’evoluzione di internet
1945 1995
2- Web 1.0
• Il World Wide Web ("WWW" o semplicemente il "Web") è un sistema di documenti ipertestuali interconnessi in internet
• Con un Web browser, un utente vede pagine Web che possono contenere testo, immagini, e altri contenuti multimediali, e naviga tra loro usando hyperlink ovvero collegamenti.
2- Principi del Web 1.0
• Il successo del Web 1.0 è basato su tre semplici principi:1. Uno schema semplice ed uniforme per identificare
pezzi di informazione, cioè l’Uniform Resource Identifiers (URIs) o Uniform Resource Locator (URL)
2. Un formalismo semplice ed uniforme per strutturare pezzi di informazione permettendo ai browser di rappresentarli, cioè l’Hyper Text Markup Language (HTML)
3. Un protocollo semplice ed uniforme per accedere ai pezzi di informazione, cioè l’Hyper Text Transfer Protocol (HTTP)
3- Web 2.0
Il termine "Web 2.0" (2004–presente) è comunemente associato con applicazioni web che facilitano la condivisione interattiva di informazioni, l’interoperabilità, design centrato sull’utente, e la collaborazione nel World-Wide Web
Web 2.0
Un sito Web 2.0 permette agli utenti di interagire e collaborare tra di loro in un dialogo di social media come creatori di contenuto generato dagli utenti in una comunità virtuale, in contrasto con siti web dove l’accesso è limitato alla visione del contenuto.
commenti
social networks
blogs
wikis
siti di condivisione multimediale
Web 2.0
Con la tecnologia del Web 1.0, un ingente investimento in capacità informatiche e in software era necessario per pubblicare informazioni.
Con la tecnologia Web 2.0
tutto è cambiato.
Rich Site Summary
Svolte prodotte dal Web 2.0
1. Sfumare la separazione tra consumatore e produttore di contenuti (Wiki, Blog, Flickr, Twitter, Youtube, …)
2. Spostare l’attenzione dai contenuti per gli individui ai contenuti per le comunità (Facebook, LinkedIn, …)
3. Sfumare la distinzione tra fruitori e fornitori di servizi (Amazon, Unilibro, Wordpress, Questbase, Aruba, …)
4. Integrare il lavoro umano e del calcolatore in una maniera innovativa (mix di lavoro manuale e automatico, come Amazon Mechanical Turk)
Limitazioni del Web 2.0
A. Trovare informazioni rilevanti
B. Estrarre informazioni rilevanti
C. Combinare e riusare informazioni
Trovare informazioni rilevanti
• Il reperimento di informazioni sul web è attualmente basato sulla ricerca per parole chiave (keyword)
• La ricerca per parola chiave ha limiti nella precisione e capacità di richiamo a causa di :– Sinonimia: “macchina” non include
“automobile”– Omonimia: “boa” dà risultati perBank of AmericaKwon Boa, cantanteBoa constrictorla boa
Trovare informazioni rilevanti
• I limiti di precisione e richiamo efficace sono dovuti anche a:– Varianti linguistiche (molto più comuni in
inglese)– Lingue differenti– Errori di digitazione
• I motori di ricerca attualmente non permettono di specificare la relazione tra una parola chiave e la risorsa in rete– Ad esempio: “acquisto” non porta
neessariamente a siti di e-commerce.
B- Estrarre informazioni rilevanti• Non esiste una soluzione automatica per estrarre
informazioni da pagine Web a causa di formati differenti e differente sintassi
• Anche da una singola pagina è difficile estrarre le informazioni rilevanti:
Quale libro parla di boa?
Qual è il prezzo del libro?
Estrarre informazioni rilevanti
WEBHTML pages
Layout
Dati strutturati,Database,
XMLStructure
XML Wrapper
estraeannotastruttura
Trasformazione XML:eXtensible Markup Language
C- Combinare e riusare informazioni
Gli obiettivi che ci si pongono spesso coivolgono la necessità di combinare i dati raccolti
1. Vogliamo raccogliere informazioni simili su differenti raccolte digitali (comprendere un argomento di lezione,…)
2. Vogliamo le informazioni che provengono da siti web differenti perché dobbiamo combinarle insieme (fare una ricerca di scienze,…)
Combinare e riusare informazioni
1. Le informazioni simili su differenti raccolte digitali
Esempio: un viaggio da Innsbruck a Roma (FS, OBB, offerte biglietti)
Combinare e riusare informazioni
2. Le informazioni provengono da siti web differenti e necessitano di essere combinate
Esempio: un viaggio da Innsbruck a Roma dove devo pernottare e visitare i musei cittadini
Come migliorare il Web attuale?
• Aumentando la connessione automatica tra i dati• Aumentanto precisione e capacità di richiamo nelle
ricerche• Aumentando l’automazione nell’integrazione dei dati e
dei servizi
Forse la soluzione èl’attribuzione semantica ai dati e ai servizi
Cos’è il Web semantico?• “The Semantic Web is an extension of the current web
in which information is given well-defined meaning, better enabling computers and people to work in cooperation.”
Dall’articolo:
T. Berners-Lee, J. Hendler, O. Lassila, “The Semantic Web”, Scientific American, May 2001
well-defined meaning
Bisogna definire utili ontologie
L’ontologia è (per questo scopo):
la formale, esplicita specificazione di una concettualizzazione condivisa
Come ad esempio nella mappa concettuale per la scuola:
• Concetti
• Proprietà • Relazioni
• Assiomi(per esperti informatici e filosofi)
Persona
Studente Docente
Lezione
Nome email
Matricola nrdisciplina
argomentoLezione nr
segue tiene
Tiene (Docente, Lezione) =>Lezione.argomento = Docente.disciplina
Web semantico dei Dati
1. Annotazione semantica dei Dati nel Web
2. Web dei Dati
3. Integrazione dei Dati nel Web
1. Annotazione semantica dei Dati nel Web
Connettere oggetti Web (sintassi) con il loro significato (semantica) come in questo esempio:
3. Integrazione dei Dati nel Web
• L’integrazione dei dati implica il combinare dati che risiedono in siti differenti e il fornire l’utente con una visione unificata di questi dati.
• L’integrazione dei dati nel Web può essere implementata con modelli specifici per addetti ai lavori.
Le tre richieste perché funzioni il Web semantico
• Logica unificante– Mette insieme le varie ontologie e le regole che le
dominano– Inferenze e significati comuni/condivisi
• Prove/evidenze– Spiegazione dei dati di inferenza, della provenienza dei
dati• Credito/fiducia
– Fiducia che il sistema operi correttamente– Fiducia che il sistema possa spiegare ciò che sta facendo– Rete di fiducia per le origini dei dati e dei servizi
• Evolution Web 1.0, Web 2.0 to Web 3.0• https://www.youtube.com/watch?v=bsNcjya56v8
• Web today -Web 2.0• https://www.youtube.com/watch?v=6gmP4nk0EOE
• The Future Internet: Service Web 3.0• https://www.youtube.com/watch?v=off08As3siM
• Web 3.0 - The Internet of Things!• https://www.youtube.com/watch?v=F_nbUizGeEY
• Web 3.0• http://www.sti-innsbruck.at/results/movies/web-30
Per i più curiosi…
Sitografia e bibliografia
• “A Survey on Tools Essential for Semantic Web Research”, International Journal of Computer Applications (0975 – 8887) Volume 62, No.9, January 2013
• “A Review on Semantic-Based Web Mining and its Applications”, Sivakumar J et al., International Journal of Engineering and Technology (IJET)
• “How robust is the Internet?”, Yuhai Tu, Nature 406, 353-354 (27 July 2000), doi:10.1038/35019222
• T. Berners-Lee, J. Hendler, O. Lassila, “The Semantic Web”, Scientific American, May 2001
• KarwanJacksi.net• lod-cloud.net• datahub.io/dataset/geospecies
Sitografia e bibliografia
• Wikipedia– https://en.wikipedia.org/wiki/Internet– https://en.wikipedia.org/wiki/World_Wide_Web– https://en.wikipedia.org/wiki/Web_2.0– http://en.wikipedia.org/wiki/Semantic_Web– https://en.wikipedia.org/wiki/Amazon_Mechanical_Turk– http://en.wikipedia.org/wiki/Linked_Data
• Altro– http://www.w3.org/TR/xslt– http://www.ontoprise.de– http://linkeddata.org– http://www.w3.org/People/Ivan/CorePresentations/SWTutorial/Slides.pdf– http://
sti-innsbruck.at/sites/default/files/courses/01_SW-Introduction.pdf– http
://facweb.cs.depaul.edu/mobasher/classes/it130/internet-www/index.html