21
11-Maggio-2004 Innovazione e Qualità dei Dati 1 INNOVAZIONE E QUALITA’ DEI DATI Marcello Sabatini [email protected] www.msconsulting.it

Innovazione e Qualità dei Dati

Embed Size (px)

DESCRIPTION

What is data quality and why it represents a strategic asset for companies (italian)

Citation preview

Page 1: Innovazione e Qualità dei Dati

11-Maggio-2004 Innovazione e Qualità dei Dati 1

INNOVAZIONE E

QUALITA’ DEI DATI

Marcello Sabatini

[email protected]

www.msconsulting.it

Page 2: Innovazione e Qualità dei Dati

11-Maggio-2004 Innovazione e Qualità dei Dati 2

La qualità dei datiPerché preoccuparsene

I DATI : UN ASSET ….

DATI

CONOSCENZA

SETTOREINDUSTRIALE

AZIENDA

OSSERVAZIONE RACCOLTA DATI STRATEGIA

CLIENTI FORNITORI CONCORRENTI

PROCESSI RISORSE

Page 3: Innovazione e Qualità dei Dati

11-Maggio-2004 Innovazione e Qualità dei Dati 3

La qualità dei datiPerché preoccuparsene

…DIFFERENTE DAGLI ASSET TRADIZIONALI,…

ALCUNE DIFFERENZE DAGLI ASSET TRADIZIONALI

SONO INTANGIBILI

SONO DUPLICABILI

NON SONO SOGGETTI AD USURA

NON SONO VALORIZZATI IN BILANCIO

Page 4: Innovazione e Qualità dei Dati

11-Maggio-2004 Innovazione e Qualità dei Dati 4

• GLI ASSET INTANGIBILI RAPPRESENTANO IL VERO ELEMENTO DISTINTIVO DI OGNI AZIENDA

• LA CURA DELLA QUALITA’ DEI DATI E’ UNA POTENZIALE SORGENTE DI VANTAGGIO COMPETITIVO

La qualità dei datiPerché preoccuparsene

…DI IMPORTANZA STRATEGICA,…

Page 5: Innovazione e Qualità dei Dati

11-Maggio-2004 Innovazione e Qualità dei Dati 5

La qualità dei datiPerché preoccuparsene

La qualità dell’informazione degrada con il passare del tempo

Qualità

Tempo

Si stima che il numero direcord errati in un database“trascurato” varidallo 0,5% al 30%

…MA STORICAMENTE TRASCURATO

Page 6: Innovazione e Qualità dei Dati

11-Maggio-2004 Innovazione e Qualità dei Dati 6

Data Entry del personale : 76%

La qualità dell’informazioneI nemici dei dati

Data Entry dei clienti : 25%

Modifiche ai sistemi: 53%

Migrazioni/Conversioni: 48%

Differenti aspettative degli utenti: 46%

Acquisizione dati dall’ esterno: 34%

Errori di sistema: 26%

Altri: 12%

The Datawarehousing Institute: Data Quality Survey, Dec 2001

Qualità

Tempo

Page 7: Innovazione e Qualità dei Dati

11-Maggio-2004 Innovazione e Qualità dei Dati 7

Problemi tipici derivanti dallascarsa qualità dei dati

The Datawarehousing Institute: Data Quality Survey, Dec 2001

Tempo per la riconciliazione dei dati: 87%

Perdita di credibilità nei sistemi : 81%

Extra costi : 72%

Clienti insoddisfatti : 67%

Ritardi nell’ attivare nuovi sistemi : 64%

Mancati ricavi : 54%

Problemi di integrazione: 38%

Altri: 5%

600 MLD USD/anno

Stima delle perditein USA

Page 8: Innovazione e Qualità dei Dati

11-Maggio-2004 Innovazione e Qualità dei Dati 8

ANALISI DI QUALITA’

Ma cos’è la QUALITA’ DEI DATI?

Page 9: Innovazione e Qualità dei Dati

11-Maggio-2004 Innovazione e Qualità dei Dati 9

QUALITA’ DEI DATI

►E’ il livello di rispondenza alla realtà

►E’ il livello di efficienza con il quale l’informazione contribuisce al raggiungimento di obiettivi

Page 10: Innovazione e Qualità dei Dati

11-Maggio-2004 Innovazione e Qualità dei Dati 10

Le proprietà di una base informativa

Gli indicatori utilizzati:

• Completezza

• Consistenza

• Validità

• Disponibilità

• Accessibilità

Alimentazione dei dati

Fruizione dei dati

Page 11: Innovazione e Qualità dei Dati

11-Maggio-2004 Innovazione e Qualità dei Dati 11

Le proprietà di una base informativa

DB

Alimentazione del DB

Fruizione del DB

Altri DB

Personale

Web

Decisioni

Controllo

Operazioni

•Completezza•Consistenza•Validità

•Disponibilità•Accessibilità

Page 12: Innovazione e Qualità dei Dati

11-Maggio-2004 Innovazione e Qualità dei Dati 12

Strumenti per l’ assicurazione di qualità dei dati

►Analisi sintattica (Parsing)►Correzione di alcune categorie di errori (Cleansing)►Riconoscimento dei duplicati (Record Matching)►Analisi delle regole (Data Mining)

Page 13: Innovazione e Qualità dei Dati

11-Maggio-2004 Innovazione e Qualità dei Dati 13

Nome : Marco Antonio RossiIndirizzo: Via Aureia 120 56100 Pisa

Parsing

Nome: Marco Secondo Nome: AntonioCognome: RossiVia: AureiaNo : 120CAP: 56100Città: Pisa

Strumenti per l’ assicurazione di qualità dei dati

Page 14: Innovazione e Qualità dei Dati

11-Maggio-2004 Innovazione e Qualità dei Dati 14

Data Cleansing

Nome: Marco Secondo Nome: AntonioCognome: RossiVia: AureiaNo : 120CAP: 56100Città: Pisa

Nome: Marco Secondo Nome: AntonioCognome: RossiVia: AureliaNo : 120CAP: 56100Città: Pisa

Strumenti per l’ assicurazione di qualità dei dati

Page 15: Innovazione e Qualità dei Dati

11-Maggio-2004 Innovazione e Qualità dei Dati 15

Strumenti per l’ assicurazione di qualità dei dati

Data Mining

DB

Regole,Fenomeni

ES: I clienti dell’area MilaneseContattati da M. Rossi prima del10-12-2000, hanno comprato nel 2001

Page 16: Innovazione e Qualità dei Dati

11-Maggio-2004 Innovazione e Qualità dei Dati 16

Strumenti per l’ assicurazione di qualità dei dati

Name: Katherine Second Name: JaneSurname: GallagherStreet: Park AvenueNo : 120Zip: 56100City: New York

Name: Katy Second Name: J.Surname: GallagherStreet: Park Av.No : 120Zip: 56100City: N.Y.

Record Matching

Name: Katherine Second Name: JaneSurname: GallagherStreet: Park AvenueNo : 120Zip: 56100City: New York

Page 17: Innovazione e Qualità dei Dati

11-Maggio-2004 Innovazione e Qualità dei Dati 17

• Prevenire è meglio che curare

QUANDO INTERVENIRE

COSTO DEI DIFETTI

PR

EV

EN

ZIO

NE

CU

RA

RIP

AR

AZ

ION

ECOSTO DELLA GESTIONEDELLA QUALITA’ DEI DATI

Page 18: Innovazione e Qualità dei Dati

11-Maggio-2004 Innovazione e Qualità dei Dati 18

QUANDO INTERVENIRE

DATI

CONOSCENZA

RACCOLTA DATI STRATEGIA ATTUAZIONE

PROCESSI

PRODOTTI

CLIENTI

PREVENZIONE=

POLITICHE+

STRUMENTI

COSTO DEI DIFETTI IN ASSENZA DI STRATEGIA DI GESTIONE DELLA QUALITA’ DEI DATI

BASSO MEDIO

ALTO

ALTISSIMO

INCALCOLABILE

Page 19: Innovazione e Qualità dei Dati

11-Maggio-2004 Innovazione e Qualità dei Dati 19

QUANDO INTERVENIRE

DATI

CONOSCENZA

RACCOLTA DATI STRATEGIA ATTUAZIONE

PROCESSI

PRODOTTI

CLIENTI

PREVENZIONE=

POLITICHE+

STRUMENTI

COSTO DELLA GESTIONE DELLA QUALITA’ DEI DATI

ALTO MEDIO

BASSO

BASSO

BASSO

Page 20: Innovazione e Qualità dei Dati

11-Maggio-2004 Innovazione e Qualità dei Dati 20

Politica di gestione

• Alcune voci– QUALITA’– INVENTARIO DEI DATI– CONDIVISIONE E DISPONIBILITA’– SICUREZZA, PRIVACY e USO APPROPRIATO– PIANIFICAZIONE

Page 21: Innovazione e Qualità dei Dati

11-Maggio-2004 Innovazione e Qualità dei Dati 21

• IL QUESTIONARIO– Si sono verificati danni/perdite causati da problemi legati ai dati?

– Quale percentuale di ricavi dipende da decisioni e processi automatici basati sui nostri dati?

– Che spazio ha il tema “Gestione dei dati” nelle riunioni di management e nel CdA?

– Chi è il responsabile della qualità dei dati?

– Abbiamo una strategia definita per l’ assicurazione e il controllo della qualità dei dati?

– Ci fidiamo della qualità dei nostri dati?

AUTO-DIAGNOSI