20
Big Data Avv. Roberto Camilli

Overview big data avv. roberto camilli

Embed Size (px)

Citation preview

  • 1. Big DataAvv. Roberto Camilli

2. Big Data Tante definizioni Un solo concetto semplice Grandi quantit di dati strutturati e non strutturati daorganizzare ed analizzare Da qualche gigabyte ai terabyte, ai petabyte fino agli zettabyte eyottabyte 3. Dimensioni dei Big Data 4. Esempi estremi di Big Data Il sistema di generazione dati della Climate Corporation - migliaia di serverper rielaborare periodicamente decenni di dati storici e generare 10.000possibili scenari relativi al tempo per ogni collocazione geografica egrandezza, si traduce in oltre 10 trilioni di dati relativi a possibili scenari (adesempio, un valore atteso di pioggia in un luogo specifico e in un momentospecifico) che possono essere utilizzati per determinare lammontare delpremio assicurativo e per lanalisi dei rischi, per un totale di oltre 50 terabytedi dati presenti nei sistemi di raccolta in un qualsiasi momento. La Sloan Digital Sky Survey (SDSS) ha iniziato a raccogliere dati astronomicinel 2000 ed riuscita a raccogliere nelle prime settimane di attivit pi datidi quanti ne siano mai stati raccolti nella storia dellastronomia. Lavorandoad un ritmo di circa 200 GB per notte, SDSS ha accumulato gi pi di 140terabyte di informazioni. In totale i quattro rivelatori principali del Large Hadron Collider (LHC) diGinevra hanno prodotto 13 petabyte di dati nel 2010 (13.000 terabyte) 5. Overview Cosa intendiamo per Big Data? Unindustria in crescita Esempi da vendors La visione universitaria Problematiche legali Discussioni 6. Cosa intendiamo per Big Data? McKinsey & Company nel suo report di giugno 2011 indica che iltermine Big Data si riferisce a quei database la cui dimensione aldi l della capacit di gestione dei normali strumenti software perdatabase. Questa definizione volutamente soggettiva e incorporauna definizione in evoluzione di quanto debba essere grande un set didati per poter essere considerato big data ... SAS/CEBR report (aprile 2012): La quantit di dati continua acrescere in modo esponenziale, generata da Internet, dai social media,dal cloud computing e dai dispositivi mobili, si pone quindi una sfidaed unopportunit per le organizzazioni come gestire, analizzare edutilizzare la sempre maggiore quantit di dati generati. Big Data un concetto aperto e la definizione variabile, dipende dallapotenza a diposizione ma anche una quantit di dati relativamentepiccola pu creare problemi di gestione 7. Dove possibile reperire i Big Data? Da dove arrivano? Dati strutturati e non strutturati Quanto costano la gestione e raccolta di questi dati? necessaria una nuova infrastruttura IT? Occorre un progetto di analisi e obiettivi da raggiungere 8. Dati Interni Ogni organizzazione produce un grande numero di dati o vi haaccesso. Questi dati sono molto spesso trascurati, conservati ma non utilizzatioppure semplicemente cancellati e persi. Dati macchina, e-mail, documenti, processi, sensori, traffico web ecc. 9. Il mondo digitale Il mondo dei dispositivi mobili e dei social network genera un numerosempre maggiore di nuovi dati personali e le stesse opinioni degliutenti possono fornire indicazioni che prima non eranosemplicemente disponibili 10. Cosa si intende per Big Data? Le tre V Volume il volume dei dati sempre pi grande I dati globali digitali sono arrivati fino a 1.227 exabyte nel 2010 e si prevede diraggiungere 7.910 exabyte nel 2015. Secondo una stima, se solo un exabyte di dati fossesalvato su DVD sarebbero necessari 13513 Boeing 747 per il trasporto di tutti i DVDutilizzati. Velocit aumento della velocit di creazione, acquisizione e condivisione dei dati A partire dal 2000 fino al 2010, la Sloan Digital Sky Survey ha raccolto 140 terabytes diinformazioni. Nel 2016, il suo erede sar in grado di raccogliere lo stesso quantitativo diinformazioni ogni cinque anni Variet proliferazione di tipologie diverse di dati 80-85% dei dati a livello globale sono considerati attualmente non strutturati. Ad esempio, lo possono essere i dati relativi al traffico o alla geolocalizzazione tratti datelecomunicazioni, blog, RFID e dati derivanti da sensori, gli spostamenti dei veicoli odati relativi alla posizione degli aeromobili, i dati relativi alle condizioni meteo, alletransazioni finanziarie, alle statistiche di vendita, analisi delle parole chiave etc. Valore, Visione non limitiamo il concetto alla terminologia 11. Cloud Computing Il Cloud computing permette laccesso, la riorganizzazione e lutilizzo delBig Data fornendo un accesso virtualmente illimitato ed economico arisorse hardware e software e ad uno spazio di archiviazione praticamenteillimitato ed utilizzabile in modo elastico Progetti di analisi dei dati possono essere usati separatamente edindipendentemente dal nucleo centrale delle funzioni e dei sistemi aziendali enon appesantire i sistemi aziendali Opportunit e problemi delluso del Cloud, non pi silos ma unico database 12. Cosa pu essere fatto con i Big Data Data Mining e Data Extraction Analisi e Visualizzazione dei dati Infinite possibilit di raccolta dati e business intelligence Identificazione trend, rischi, errori, sprechi Monitoraggio in tempo reale Dati oggettivi Nuove opportunit di business 13. Alcuni esempi Fashion - percezione del brand - sentiment degli utenti studio dei trend -logistica - contraffazione analisi concorrenti Automotive analisi dati sensori di bordo, manutenzione predittiva,assistenza, correzione errori, prevenzioni incidenti, assistenza alla guida,logistica prodotti e ricambi, studio garanzie prodotti Life Science studi osservazionali utilizzo farmaci, studio trendepidemiologici popolazione, studio parametri esclusione per studi clinici,studio necessit popolazione, identificazione frodi Retail Dati utente su consumi e budget di spesa, analisi uso siti ed e-commerce, preferenze di acquisto, interazione tramite strumenti portatiliutenti, personalizzazione esperienza dacquisto, smart carts, apps e rfid codessui prodotti, suggerimenti e promozioni in tempo reale, strumenti dicomparazione prezzi, geolocalizzazione 14. Ulteriori esempi Banche connessione dati operazioni e iniziative retail, studio dei portafogli,studio sentiment clienti, servizi valore aggiunto clienti, controllo eprevenzione frodi Logistica integrazione con dati retail, consumi e preferenze, datipromozioni e interventi in garanzia , ottimizzazione consegna e magazzino,logistica real time e consegne nello stesso giorno, dati di spedizione, viaggio,consegna in tempo reale Advertising e Marketing studio sentiment social network, modellocomunicazione mirata al singolo utente, uso di strumenti per analisisemantica, linguaggio naturale e studio di cluster informativi Assicurazioni personalizzazione polizze e coperture a secondo delcomportamento utente, studio storia veicolo, analisi rischi reali beneassicurato, individuazione frodi, dati ambientali per calcolo rischio 15. Problematiche legali1 Chi possiede i Big Data? Creazione e gestione del database Direttiva relativa al settore degli Open Data pubblici Dati generati dagli utenti Dati organizzati e strutturati Dati non strutturati Dati estratti ed analizzati Diritti dei fornitori di strumenti relativi a Big Data 16. Problematiche legali2 Tutti diventeremo dei big brother? Nuova proposta di regolamento UE per il trattamento dei dati personali(privacy by design, diritto alloblio) Nuove tipologie di consenso, data portability, trasferimento allestero Come rispettare il diritto di accesso e cancellazione? Dati personali persi allinterno dei Big Data Dati estratti dallassociazione di informazioni Data Breach Notification Incidente Target (previsione gravidanza) 17. Problematiche legali3 I limiti del copyright Big Dataed il principio dellesaurimento Eccezioni al diritto dautore Necessit di licenze per analizzare materiale protetto Lanalisi dei dati pu essere considerata utilizzo dei contenuti? Copia? Proposte di liberalizzazione per attivit e strumenti analitici Big Data un nuovo strumento contro la pirateria? Proteggibilit del database e dei risultati delle analisi 18. Problematiche legali4 Sicurezza e protezione dei dati, necessit di garanzie Aspetti Antitrust Rapporti con licenze open source Uso dei dati in ambito contenzioso Aumento delle garanzie e delle responsabilit Mercati regolamentati (borsa, finanza, banche, pubblicit, assicurazioni) 19. Thank you Avv Roberto Camilli+39 02 30 35 60 00 [email protected] & Bird is an international legal practice comprising Bird & Bird LLP and its affiliated and associated businesses. Bird & Bird LLP is a limited liability partnership, registered in England and Wales with registered number OC340318 and is authorised and regulated by theSolicitors Regulation Authority. Its registered office and principal place of business is at 15 Fetter Lane, London EC4A 1JP. A list of members of Bird & Bird LLP and of any non-members who are designated as partners, and of their respective professional qualifications, is open to inspection at that address.twobirds.com