Upload
marcello-sabatini
View
1.380
Download
2
Embed Size (px)
DESCRIPTION
What is data quality and why it represents a strategic asset for companies (italian)
Citation preview
11-Maggio-2004 Innovazione e Qualità dei Dati 1
INNOVAZIONE E
QUALITA’ DEI DATI
Marcello Sabatini
www.msconsulting.it
11-Maggio-2004 Innovazione e Qualità dei Dati 2
La qualità dei datiPerché preoccuparsene
I DATI : UN ASSET ….
DATI
CONOSCENZA
SETTOREINDUSTRIALE
AZIENDA
OSSERVAZIONE RACCOLTA DATI STRATEGIA
CLIENTI FORNITORI CONCORRENTI
PROCESSI RISORSE
11-Maggio-2004 Innovazione e Qualità dei Dati 3
La qualità dei datiPerché preoccuparsene
…DIFFERENTE DAGLI ASSET TRADIZIONALI,…
ALCUNE DIFFERENZE DAGLI ASSET TRADIZIONALI
SONO INTANGIBILI
SONO DUPLICABILI
NON SONO SOGGETTI AD USURA
NON SONO VALORIZZATI IN BILANCIO
11-Maggio-2004 Innovazione e Qualità dei Dati 4
• GLI ASSET INTANGIBILI RAPPRESENTANO IL VERO ELEMENTO DISTINTIVO DI OGNI AZIENDA
• LA CURA DELLA QUALITA’ DEI DATI E’ UNA POTENZIALE SORGENTE DI VANTAGGIO COMPETITIVO
La qualità dei datiPerché preoccuparsene
…DI IMPORTANZA STRATEGICA,…
11-Maggio-2004 Innovazione e Qualità dei Dati 5
La qualità dei datiPerché preoccuparsene
La qualità dell’informazione degrada con il passare del tempo
Qualità
Tempo
Si stima che il numero direcord errati in un database“trascurato” varidallo 0,5% al 30%
…MA STORICAMENTE TRASCURATO
11-Maggio-2004 Innovazione e Qualità dei Dati 6
Data Entry del personale : 76%
La qualità dell’informazioneI nemici dei dati
Data Entry dei clienti : 25%
Modifiche ai sistemi: 53%
Migrazioni/Conversioni: 48%
Differenti aspettative degli utenti: 46%
Acquisizione dati dall’ esterno: 34%
Errori di sistema: 26%
Altri: 12%
The Datawarehousing Institute: Data Quality Survey, Dec 2001
Qualità
Tempo
11-Maggio-2004 Innovazione e Qualità dei Dati 7
Problemi tipici derivanti dallascarsa qualità dei dati
The Datawarehousing Institute: Data Quality Survey, Dec 2001
Tempo per la riconciliazione dei dati: 87%
Perdita di credibilità nei sistemi : 81%
Extra costi : 72%
Clienti insoddisfatti : 67%
Ritardi nell’ attivare nuovi sistemi : 64%
Mancati ricavi : 54%
Problemi di integrazione: 38%
Altri: 5%
600 MLD USD/anno
Stima delle perditein USA
11-Maggio-2004 Innovazione e Qualità dei Dati 8
ANALISI DI QUALITA’
Ma cos’è la QUALITA’ DEI DATI?
11-Maggio-2004 Innovazione e Qualità dei Dati 9
QUALITA’ DEI DATI
►E’ il livello di rispondenza alla realtà
►E’ il livello di efficienza con il quale l’informazione contribuisce al raggiungimento di obiettivi
11-Maggio-2004 Innovazione e Qualità dei Dati 10
Le proprietà di una base informativa
Gli indicatori utilizzati:
• Completezza
• Consistenza
• Validità
• Disponibilità
• Accessibilità
Alimentazione dei dati
Fruizione dei dati
11-Maggio-2004 Innovazione e Qualità dei Dati 11
Le proprietà di una base informativa
DB
Alimentazione del DB
Fruizione del DB
Altri DB
Personale
Web
Decisioni
Controllo
Operazioni
•Completezza•Consistenza•Validità
•Disponibilità•Accessibilità
11-Maggio-2004 Innovazione e Qualità dei Dati 12
Strumenti per l’ assicurazione di qualità dei dati
►Analisi sintattica (Parsing)►Correzione di alcune categorie di errori (Cleansing)►Riconoscimento dei duplicati (Record Matching)►Analisi delle regole (Data Mining)
11-Maggio-2004 Innovazione e Qualità dei Dati 13
Nome : Marco Antonio RossiIndirizzo: Via Aureia 120 56100 Pisa
Parsing
Nome: Marco Secondo Nome: AntonioCognome: RossiVia: AureiaNo : 120CAP: 56100Città: Pisa
Strumenti per l’ assicurazione di qualità dei dati
11-Maggio-2004 Innovazione e Qualità dei Dati 14
Data Cleansing
Nome: Marco Secondo Nome: AntonioCognome: RossiVia: AureiaNo : 120CAP: 56100Città: Pisa
Nome: Marco Secondo Nome: AntonioCognome: RossiVia: AureliaNo : 120CAP: 56100Città: Pisa
Strumenti per l’ assicurazione di qualità dei dati
11-Maggio-2004 Innovazione e Qualità dei Dati 15
Strumenti per l’ assicurazione di qualità dei dati
Data Mining
DB
Regole,Fenomeni
ES: I clienti dell’area MilaneseContattati da M. Rossi prima del10-12-2000, hanno comprato nel 2001
11-Maggio-2004 Innovazione e Qualità dei Dati 16
Strumenti per l’ assicurazione di qualità dei dati
Name: Katherine Second Name: JaneSurname: GallagherStreet: Park AvenueNo : 120Zip: 56100City: New York
Name: Katy Second Name: J.Surname: GallagherStreet: Park Av.No : 120Zip: 56100City: N.Y.
Record Matching
Name: Katherine Second Name: JaneSurname: GallagherStreet: Park AvenueNo : 120Zip: 56100City: New York
11-Maggio-2004 Innovazione e Qualità dei Dati 17
• Prevenire è meglio che curare
QUANDO INTERVENIRE
COSTO DEI DIFETTI
PR
EV
EN
ZIO
NE
CU
RA
RIP
AR
AZ
ION
ECOSTO DELLA GESTIONEDELLA QUALITA’ DEI DATI
11-Maggio-2004 Innovazione e Qualità dei Dati 18
QUANDO INTERVENIRE
DATI
CONOSCENZA
RACCOLTA DATI STRATEGIA ATTUAZIONE
PROCESSI
PRODOTTI
CLIENTI
PREVENZIONE=
POLITICHE+
STRUMENTI
COSTO DEI DIFETTI IN ASSENZA DI STRATEGIA DI GESTIONE DELLA QUALITA’ DEI DATI
BASSO MEDIO
ALTO
ALTISSIMO
INCALCOLABILE
11-Maggio-2004 Innovazione e Qualità dei Dati 19
QUANDO INTERVENIRE
DATI
CONOSCENZA
RACCOLTA DATI STRATEGIA ATTUAZIONE
PROCESSI
PRODOTTI
CLIENTI
PREVENZIONE=
POLITICHE+
STRUMENTI
COSTO DELLA GESTIONE DELLA QUALITA’ DEI DATI
ALTO MEDIO
BASSO
BASSO
BASSO
11-Maggio-2004 Innovazione e Qualità dei Dati 20
Politica di gestione
• Alcune voci– QUALITA’– INVENTARIO DEI DATI– CONDIVISIONE E DISPONIBILITA’– SICUREZZA, PRIVACY e USO APPROPRIATO– PIANIFICAZIONE
11-Maggio-2004 Innovazione e Qualità dei Dati 21
• IL QUESTIONARIO– Si sono verificati danni/perdite causati da problemi legati ai dati?
– Quale percentuale di ricavi dipende da decisioni e processi automatici basati sui nostri dati?
– Che spazio ha il tema “Gestione dei dati” nelle riunioni di management e nel CdA?
– Chi è il responsabile della qualità dei dati?
– Abbiamo una strategia definita per l’ assicurazione e il controllo della qualità dei dati?
– Ci fidiamo della qualità dei nostri dati?
AUTO-DIAGNOSI