38
Big Data : volume di dati livelli variabili di complessità generati a velocità differenti non elaborabili con tecnologie tradizionali

Big Data : volume di dati livelli variabili di complessità generati a velocità differenti

  • Upload
    pink

  • View
    42

  • Download
    0

Embed Size (px)

DESCRIPTION

Big Data : volume di dati livelli variabili di complessità generati a velocità differenti non elaborabili con tecnologie tradizionali. LE TRE V. Volume : gestione di moltissimi dati Velocità : gestione in tempo reale Varietà : fonti e tipologie diverse. - PowerPoint PPT Presentation

Citation preview

Page 1: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

Big Data : volume di dati livelli variabili di complessità generati a velocità differenti non elaborabili con tecnologie tradizionali

Page 2: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

LE TRE V

Volume: gestione di moltissimi dati

Velocità: gestione in tempo reale

Varietà: fonti e tipologie diverse

Page 3: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

DUE V IN PIÙ

Veridicità: attendibilità dei dati raccolti

Volatilità: tempo di validità dei dati

Page 4: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

PERCHÉ UTILIZZARE I BIG DATA

Opportunità di conoscenza Capire il mondo reale Opportunità commerciali

Page 5: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

DATI NON STRUTTURATI

Non possiedono un modello prestabilito Non sono organizzati Possono causare ambiguità Sono costituiti da:

› Testo› Audio› Video› Flussi di click› …

Page 6: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

RACCOLTA DI DATI ORDINARI

Raccolta di informazioni Classificazione in categorie prestabilite Organizzazione secondo uno schema preciso Memorizzazione fisica dei dati

Page 7: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

ELABORAZIONE DEI BIG DATA

Collezione e memorizzazione dei dati

Classificazione per categorie

Trasformazione dei dati

Generazione dei risultati trovati

Page 8: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

ANALISI DEI COMPORTAMENTI

SOCIALI

Page 9: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

ANALISI DEI SENTIMENTI

ASCOLTARE

CAPIRE

RIELABORARE

VISUALIZZARE

Page 10: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

HEDONOMETER

Script pattern matching:› individuare tokens› stabilire il pattern delle frequenze in un testo

Set di parole:› Google books› Twitter› Canzoni 1960/2007› New York Times 1987/2007

Grado di felicitá:› Amazon’s Mechanical Turk

http://www.hedonometer.org/index.html

Page 11: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

havg(T) = livello di felicitá della frase T

havg (wi) = felicitá di ciascuna parola

Fi = frequenza della i-esima parola

Page 12: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

TWITTER ANALYSIS

484 miloni di tweets 9.8 milioni di persone Luglio 2009 e Gennaio 2012 54 piú larghe cittá della Gran Bretagna

Parole cercate: PAURA, GIOIA, RABBIA, TRISTEZZA

PAPER: <<Big Data Analysis of News and Social Media Content>>Ilias Flaounas, Thomas Lansdall-Welfare, Nello Cristianini Intelligent Systems Laboratory, University of Bristol

Page 13: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

GRAFICO DELLA GIOIA

GRAFICO

DELLA RABBIA

TIMELINE GENERATE

Page 14: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

GRAFICO SETTIMANA

LE

GRAFICO GIORNALIER

O

PAPER: <<Temporal patterns of happiness in a global social network: Hedonometrics and Twitter>> P. Sheridan Dodds, K. Decker Harris, I. Kloumann, Center of complex systems of the university of Vermont

Page 15: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

VOICES FROM THE BLOG

http://www.blogsvoices.unimi.it

Page 16: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

LIMITAZIONI

AMBIGUITÁ SENSI MULTIPLI TONO SARCASMO SOPRANNOMI IMMAGINI

Page 17: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

CONSIDERAZIONI

«Il Big Data ha avuto un impatto nello studio del comportamento umano simile all’introduzione del microscopio o del telescopio nei campi della biologia e dell’astronomia»

Zeynep Tufekci “Big Questions for Social Media Big Data”

Page 18: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

BIG DATA E

LE AZIENDE

Page 19: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

BIG DATA vs MARKETING

Big Data aiutano a comprendere le dinamiche del proprio mercato di riferimento

Per riuscire a trarne il massimo bisogna sodisfare alcuni requisiti:› Nuova mentalità› Leadership› Team di ricerca› Gestione dei dati

Page 20: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

BIG DATA vs ROI

Big Data + Marketing = ROI enorme

¿RisultatoOperativo

Capitale investito nettooperatvo

Page 21: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

Perché le aziende ti conoscono

meglio della tua famiglia

Attraverso un’analisi dei dati il negozio Target è riuscito a scoprire che una ragazza era incinta, ancora prima che lo sapessero i suoi genitori.

Fedelity Card

Informazioni Personali

+Informazioni di

Vendita

Big Data

Page 22: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

AMAZON 152 milioni di conti cliente

Ricerche+

Acquisti+

Desideri

Big DataPubblicit

à

Amazon Web Services:• Raccolta• Archiviazione• Calcolo• Condivisione

Page 23: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

AMAZON CLOUD DRIVE

5 GB gratis 1.000 GB massimo 2 GB trasferimento massimo per file $ 0.50 per GB Online software Cloud Player

Page 24: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

SPEDIZIONE ANTICIPATA

Obiettivi: Restringere tempi di attesa Predire gli ordini del cliente

« Se non lo vuoi, te lo regaliamo! »

Page 25: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

SPEDIZIONE CON DRONIAmazon Prime Air:

15 KM massimo 2 KG massimo Spediti 30/60 minuti dall’ordine Ricevuti nella stessa giornata dell’ordine

Page 26: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

Servizi per: Utenti:

› Motore di ricerca› Chrome› Gmail

Aziende:› Pubblicità con testo› Pubblicità multimediale

Page 27: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

GOOGLE NOW OGGI

Schede: Traffico Meteo Sport Attività Appuntamenti

Trasporto pubblico Attrazioni nelle vicinanze Amici nelle vicinanze Notizie

Page 28: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

GOOGLE NOW DOMANI Salvataggio posizione parcheggio Conto alla rovescia Promemoria pagamento bollette

DATI GOOGLE NOW

Cronologia delle posizioni GPS Gmail Calendario Contatti Ricerche Google

Page 29: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

RICERCA TRAMITE IMMAGINE

Ricerca per: Trascinamento Caricamento URL Click su un’immagine Web

Risultati: Immagine stessa Immagini simili Siti web contenenti immagini

simili

Page 30: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

Caratteristiche: 80 lingue traduzione automatica statistica possibilità di cambiare il testo tradotto

scegliendo alternative da un elenco esistente

News: « Improve this translation »

Page 31: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

Google Translate : App

immissione vocale fotocamera scrittura a mano

libera modalità offline

Page 32: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

INFORMATION RETRIEVAL

Reperimento delle informazioni:È l'insieme delle tecniche utilizzate per gestire oggetti contenenti informazioni

Page 33: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

INFORMATION RETRIEVAL

Permette di:

Rappresentare Memorizzare Organizzare

Page 34: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

INFORMATION RETRIEVAL

Soddisfa: Il bisogno informativo

dell’utente

Gestistione: Ricerca di informazioni,

non di dati

Possibile restituzione di risultati non pertinenti

Page 35: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

È un movimento che promuove il non utilizzo del modello relazionale.

Identifica: un'ampia varietà di tecnologie legate ai database

Risponde: al crescente volume di dati memorizzati sulla Rete alle modalità e alla frequenza di accesso ai dati alla necessitá di performance e di potenza di

calcolo

Page 36: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

NOSQL I PUNTI DI FORZA

Scalabilitá

Prestazioni migliori

Schemi dinamici

Facile da utilizzare

Flessibile

Page 37: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

È un framework che supporta applicazioni distribuite con elevato accesso ai dati

Permette di lavorare con migliaia di nodi e petabyte di dati

Page 38: Big  Data  :  volume  di dati  livelli  variabili di  complessità generati  a  velocità differenti

Yahoo! è il più grande contributore a questo progetto

È usato anche da: AOL, Ebay, Facebook, IBM, ImageShack, Joost, Linkedin, Spotify, The New York Times e Twitter