35
Carlo Bidoia Insegnante di scienze matematiche fisiche e naturali Olgiate Comasco, 19/01/15 Tratto liberamente dal lavoro del Dr Karwan Jacksi Web semantico

Web semantico

Embed Size (px)

Citation preview

Carlo Bidoia

Insegnante di scienze matematiche fisiche e naturaliOlgiate Comasco, 19/01/15

Tratto liberamente dal lavoro del Dr Karwan Jacksi

Web semantico

L’evoluzione della rete Internet

Internet

Web 1.0

Web 2.0

Web semantico

1-Internet

• La rete è un sistema globale di calcolatori interconnessi che usa lo standard Internet Protocol Suite (TCP/IP) per servire miliardi di utenti in tutto il mondo.

• È una rete di reti che consiste in milioni di reti pubbliche e private, accademiche, professionali e del governo di estensione da locale a globale che sono legate da un ampia varietà di tecnologie di connessione ottiche ed elettroniche.

Dal seguente articolo:How robust is the Internet?Yuhai TuNature 406, 353-354(27 July 2000)doi:10.1038/35019222

The map was created using the skitter tool (developed by D. McRobb at CAIDA) which sends out small packets of data from a source to many destinations through the Internet. The data collected by skitter give a snapshot of the Internet at a particular moment. (Graph created by B. Huffaker using graph layout code provided by B. Cheswick and H. Burch.)

Memex Conceived

1945

WWWCreated

1989

MosaicCreated

1993

A Mathematical

Theory of Communication

1948

Packet Switching Invented

1964

SiliconChip1958

First Vast ComputerNetwork

Envisioned1962

ARPANET1969

TCP/IPCreated

1972

InternetNamed

and Goes

TCP/IP1984

HypertextInvented

1965

Age ofeCommerce

Begins1995

Un breve sommario dell’evoluzione di internet

1945 1995

2- Web 1.0

• Il World Wide Web ("WWW" o semplicemente il "Web") è un sistema di documenti ipertestuali interconnessi in internet

• Con un Web browser, un utente vede pagine Web che possono contenere testo, immagini, e altri contenuti multimediali, e naviga tra loro usando hyperlink ovvero collegamenti.

2- Principi del Web 1.0

• Il successo del Web 1.0 è basato su tre semplici principi:1. Uno schema semplice ed uniforme per identificare

pezzi di informazione, cioè l’Uniform Resource Identifiers (URIs) o Uniform Resource Locator (URL)

2. Un formalismo semplice ed uniforme per strutturare pezzi di informazione permettendo ai browser di rappresentarli, cioè l’Hyper Text Markup Language (HTML)

3. Un protocollo semplice ed uniforme per accedere ai pezzi di informazione, cioè l’Hyper Text Transfer Protocol (HTTP)

3- Web 2.0

Il termine "Web 2.0" (2004–presente) è comunemente associato con applicazioni web che facilitano la condivisione interattiva di informazioni, l’interoperabilità, design centrato sull’utente, e la collaborazione nel World-Wide Web

Web 2.0

Un sito Web 2.0 permette agli utenti di interagire e collaborare tra di loro in un dialogo di social media come creatori di contenuto generato dagli utenti in una comunità virtuale, in contrasto con siti web dove l’accesso è limitato alla visione del contenuto.

commenti

social networks

blogs

wikis

siti di condivisione multimediale

Web 2.0

Con la tecnologia del Web 1.0, un ingente investimento in capacità informatiche e in software era necessario per pubblicare informazioni.

Con la tecnologia Web 2.0

tutto è cambiato.

Rich Site Summary

Svolte prodotte dal Web 2.0

1. Sfumare la separazione tra consumatore e produttore di contenuti (Wiki, Blog, Flickr, Twitter, Youtube, …)

2. Spostare l’attenzione dai contenuti per gli individui ai contenuti per le comunità (Facebook, LinkedIn, …)

3. Sfumare la distinzione tra fruitori e fornitori di servizi (Amazon, Unilibro, Wordpress, Questbase, Aruba, …)

4. Integrare il lavoro umano e del calcolatore in una maniera innovativa (mix di lavoro manuale e automatico, come Amazon Mechanical Turk)

Limitazioni del Web 2.0

A. Trovare informazioni rilevanti

B. Estrarre informazioni rilevanti

C. Combinare e riusare informazioni

A- Trovare informazioni rilevanti

Trovare informazioni rilevanti

• Il reperimento di informazioni sul web è attualmente basato sulla ricerca per parole chiave (keyword)

• La ricerca per parola chiave ha limiti nella precisione e capacità di richiamo a causa di :– Sinonimia: “macchina” non include

“automobile”– Omonimia: “boa” dà risultati perBank of AmericaKwon Boa, cantanteBoa constrictorla boa

Trovare informazioni rilevanti

• I limiti di precisione e richiamo efficace sono dovuti anche a:– Varianti linguistiche (molto più comuni in

inglese)– Lingue differenti– Errori di digitazione

• I motori di ricerca attualmente non permettono di specificare la relazione tra una parola chiave e la risorsa in rete– Ad esempio: “acquisto” non porta

neessariamente a siti di e-commerce.

B- Estrarre informazioni rilevanti• Non esiste una soluzione automatica per estrarre

informazioni da pagine Web a causa di formati differenti e differente sintassi

• Anche da una singola pagina è difficile estrarre le informazioni rilevanti:

Quale libro parla di boa?

Qual è il prezzo del libro?

Estrarre informazioni rilevanti

WEBHTML pages

Layout

Dati strutturati,Database,

XMLStructure

XML Wrapper

estraeannotastruttura

Trasformazione XML:eXtensible Markup Language

C- Combinare e riusare informazioni

Gli obiettivi che ci si pongono spesso coivolgono la necessità di combinare i dati raccolti

1. Vogliamo raccogliere informazioni simili su differenti raccolte digitali (comprendere un argomento di lezione,…)

2. Vogliamo le informazioni che provengono da siti web differenti perché dobbiamo combinarle insieme (fare una ricerca di scienze,…)

Combinare e riusare informazioni

1. Le informazioni simili su differenti raccolte digitali

Esempio: un viaggio da Innsbruck a Roma (FS, OBB, offerte biglietti)

Combinare e riusare informazioni

2. Le informazioni provengono da siti web differenti e necessitano di essere combinate

Esempio: un viaggio da Innsbruck a Roma dove devo pernottare e visitare i musei cittadini

Come migliorare il Web attuale?

• Aumentando la connessione automatica tra i dati• Aumentanto precisione e capacità di richiamo nelle

ricerche• Aumentando l’automazione nell’integrazione dei dati e

dei servizi

Forse la soluzione èl’attribuzione semantica ai dati e ai servizi

Cos’è il Web semantico?• “The Semantic Web is an extension of the current web

in which information is given well-defined meaning, better enabling computers and people to work in cooperation.”

Dall’articolo:

T. Berners-Lee, J. Hendler, O. Lassila, “The Semantic Web”, Scientific American, May 2001

well-defined meaning

Bisogna definire utili ontologie

L’ontologia è (per questo scopo):

la formale, esplicita specificazione di una concettualizzazione condivisa

Come ad esempio nella mappa concettuale per la scuola:

• Concetti

• Proprietà • Relazioni

• Assiomi(per esperti informatici e filosofi)

Persona

Studente Docente

Lezione

Nome email

Matricola nrdisciplina

argomentoLezione nr

segue tiene

Tiene (Docente, Lezione) =>Lezione.argomento = Docente.disciplina

Web semantico dei Dati

1. Annotazione semantica dei Dati nel Web

2. Web dei Dati

3. Integrazione dei Dati nel Web

1. Annotazione semantica dei Dati nel Web

Connettere oggetti Web (sintassi) con il loro significato (semantica) come in questo esempio:

2. Web dei Dati

LinkedCT

http://lod-cloud.net

Esplicitare le connessioni tra i dati

Geospecies

http://datahub.io/dataset/geospecies

3. Integrazione dei Dati nel Web

• L’integrazione dei dati implica il combinare dati che risiedono in siti differenti e il fornire l’utente con una visione unificata di questi dati.

• L’integrazione dei dati nel Web può essere implementata con modelli specifici per addetti ai lavori.

Le tre richieste perché funzioni il Web semantico

• Logica unificante– Mette insieme le varie ontologie e le regole che le

dominano– Inferenze e significati comuni/condivisi

• Prove/evidenze– Spiegazione dei dati di inferenza, della provenienza dei

dati• Credito/fiducia

– Fiducia che il sistema operi correttamente– Fiducia che il sistema possa spiegare ciò che sta facendo– Rete di fiducia per le origini dei dati e dei servizi

Accatastamento del Web Semantico

• Evolution Web 1.0, Web 2.0 to Web 3.0• https://www.youtube.com/watch?v=bsNcjya56v8

• Web today -Web 2.0• https://www.youtube.com/watch?v=6gmP4nk0EOE

• The Future Internet: Service Web 3.0• https://www.youtube.com/watch?v=off08As3siM

• Web 3.0 - The Internet of Things!• https://www.youtube.com/watch?v=F_nbUizGeEY

• Web 3.0• http://www.sti-innsbruck.at/results/movies/web-30

Per i più curiosi…

Sitografia e bibliografia

• “A Survey on Tools Essential for Semantic Web Research”, International Journal of Computer Applications (0975 – 8887) Volume 62, No.9, January 2013

• “A Review on Semantic-Based Web Mining and its Applications”, Sivakumar J et al., International Journal of Engineering and Technology (IJET)

• “How robust is the Internet?”, Yuhai Tu, Nature 406, 353-354 (27 July 2000), doi:10.1038/35019222

• T. Berners-Lee, J. Hendler, O. Lassila, “The Semantic Web”, Scientific American, May 2001

• KarwanJacksi.net• lod-cloud.net• datahub.io/dataset/geospecies

Sitografia e bibliografia

• Wikipedia– https://en.wikipedia.org/wiki/Internet– https://en.wikipedia.org/wiki/World_Wide_Web– https://en.wikipedia.org/wiki/Web_2.0– http://en.wikipedia.org/wiki/Semantic_Web– https://en.wikipedia.org/wiki/Amazon_Mechanical_Turk– http://en.wikipedia.org/wiki/Linked_Data

• Altro– http://www.w3.org/TR/xslt– http://www.ontoprise.de– http://linkeddata.org– http://www.w3.org/People/Ivan/CorePresentations/SWTutorial/Slides.pdf– http://

sti-innsbruck.at/sites/default/files/courses/01_SW-Introduction.pdf– http

://facweb.cs.depaul.edu/mobasher/classes/it130/internet-www/index.html

GRAZIE DELL’ATTENZIONE

E ora al lavoro…