Business Intelligence Dai dati alle decisioni. Modulo 5 Customer Profiling e Data Mining Togli la causa e leffetto sparirà. (Miguel De Cervantes)

Business IntelligenceDai dati alle decisioni

Modulo 5Customer Profiling e Data Mining

Togli la causa e l’effetto sparirà. (Miguel De Cervantes)

Customer Profiling

Sistema informativo in grado di fornire, per ogni singolo cliente, un dettaglio del suo comportamento d’acquisto attuale e atteso.

Siamo identificati attraverso la transazione.

BANCA N. CONTOASSICURAZIONE N. POLIZZACASA EDITRICEN.ABBONAMENTOGAS N. CONTATORETELEFONO N. TELEFONO

TRANSAZIONE

Customer Profiling

Avere come obbiettivo il monitoraggio della transazione è un sistema naturale di controllo se vogliamo aumentare l’efficienza della PRODUZIONE e/o DISTRIBUZIONE, ma se l’obbiettivo è riconoscere, soddisfare e mantenere fedele il cliente dobbiamo cambiare punto di vista.

Rapporto personale e sulla relazione.

METODI DI ESPOSIZIONE DEI PRODOTTI

TESSERE FEDELTÀRELAZIONE

Struttura di un sistema di customer profiling

Le informazioni di cui un’azienda può disporre sono descrittive e comportamentali.

Tali informazioni sono solitamente disponibili sui sistemi amministrativi e vanno quindi integrati aumentando l’interattività tra azienda e cliente.


Persone

Programmi

Premio

Aziende

dati anagraficisocio-economicisocio-demografici settore

dimensionelocalizzazione

comportamento di acquisto

comportamento d’uso

descrittive

descrittive

comportamentali


Esempio Transazioni in banca.

N. transaz.

Cliente

Conto 1 20 A

Conto 2 5 B

Conto 3 5 C

Conto 4 10 B

Conto 5 5 B

Conto 6 5 B

20 transazione a settimana



Focus sul Cliente

B

A

C

Focus sulla

transazione


Bisogna quindi pensare a degli indici predittivi del comportamento futuro.

Lufthansa Audi Vailant

Indici predittivi

Indice della probabilità di abbandono

Indice del valore attuale netto

Indice della probabilità di frode e morosità

Indice della probabilità di acquisto

- Telefonia

- Quattroruot

e

- Finanziame

nti

- Amazon

Indici predittivi probabilità di

abbandono valore attuale netto probabilità di frode probabilità di acquisto

Tali indici vengono calcolati utilizzando come base il comportamento in un particolare periodo trascorso e applicando degli algoritmi di DATA MINING

DATI STORICI + ESEMPI GIA’ NOTI =

MODELLI PREVISIONALI

Si parte quindi dai dati storici che utilizziamo per trovare indici applicabili ai nuovi dati.

Possiamo così classificare

Direct Marketing

Punti Vendita Venditori

efficacia Customer Services

Agentiper l’effettivo potenziale affidato

Esempio di Customer Profiling

Reddito

Deb

ito

Concediamo il prestito al cliente?debito pagato

debito non pagato

Esempio di Customer Profiling

Dobbiamo cercare un modello (DATA MINING) che mi possa “assistere” alla decisione:

- Media

- Iperpiano

- Iperpiani paralleli

- Clustering

s

If (red < s)Then (“debito non pagato”)

sIf (a red + b red < s)Then (“debito non pagato”)

b

a

(Non Supervisionato)

(Non Supervisionato)

(Supervisionato)

(Supervisionato)

Data MiningSi stima che ogni 1.100 giorni, nel

mondo, raddoppiano le

informazioni memorizzate in

formato elettronico

I dati restano semplici dati finché non

vengono gestiti, ossia organizzati

in maniera significativa

Se da un lato le aziende hanno a

disposizione un’enorme

quantità di dati, dall’altro risulta

sempre più difficile districarsi tra informazioni

rilevanti e superflue.

Il Data Mining si pone come

processo che impiego più

tecniche computerizzate

per l’analisi automatica

e”l’estrazione di conoscenze”

Data Mining

Il DATA MINING si pone come processo di selezione, esplorazione e modellazione di grosse masse di dati, al fine di scoprire strutture, regolarità o relazioni non note a priori, e allo scopo di ottenere un risultato chiaro e utile al proprietario del database.

Le regole statistiche tradizionali di analisi dei dati (ad esempio la regressione) vengono utilizzate per cercare conferma a fatti che l’utente ipotizza o già conosce. Se il database è molto grande non si riesce ad avere una visione completa da cui estrapolare una regolarità e simmetrie.

L’idea è che tali strutture non sfuggano ad una elaborazione automatica.

Tra le tecniche più diffuse troviamo: Clustering Reti Neurali Reti Bayesiane Alberi di decisioni Apprendimento genetico Analisi delle associazioni

Tutte le tecniche comprendo metodi e algoritmi.

Clustering con l’algoritmo k-meansData Mining

Tecniche di Data

Mining

Supervisionate

Reti Neurali

Reti Bayesiane

Alberi di decisioniAnalisi delle

associazioni

Non-Supervision

ateClustering

Clustering con l’algoritmo k-meansData Mining

Clustering (tecnica di Cluster Analysis)

Esempio – Metodo k-means (k-medie)

metodo partizionante

ALGORITMO K-

MEANS

k-clusterrecord

INPUT OUTPUTkfunzione di media metrica


1. Scegliere un valore k=numero di cluster da determinare.

2. Scegliere in modo casuale k dati del detaset che saranno i (bari)centri del cluster.

ALGORITMO K-

MEANS

k-clusterrecord



3. Definire una metrica per calcolare la distanza dei punti dai centri.

4. Calcolare la media per ogni cluster.

ALGORITMO K-

MEANS

k-clusterrecord



5. Se le nuove medie sono identiche a quelle precedenti il processo termina; altrimenti utilizzare le nuove medie come centri dei cluster e ripetere i passi da 3. a 5.

Solitamente si preferisce fermarsi quando siamo arrivati ad un errore quadratico predefinito.

ALGORITMO K-

MEANS

k-clusterrecord

INPUT OUTPUT


Esempio su Excel x yA 1 2B 1,5 1C 2 1D 1 1,5E 4 2F 2 4G 5 2H 5 1I 3 4J 0,5 2,5K 4 3L 2 3M 1 4N 1,5 2O 5 4

0 1 2 3 4 5 60

0.5

1

1.5

2

2.5

3

3.5

4

4.5

Algoritmi di Classificazione

Valutati da• Velocità• Robustezza

• Scalabilità• Interoperabilità

Esempi di alberi di classificazione

ALBERO BINARIO ALBERO GENERICO

Accetta Comunicazione

Età Zona di residenza

SI NO ≤45 >45 Nord Centro Sud Isole


Esempio di rete neurale

Vettore di Input

Vettore di Outputx1

x2

xn-1

xn

…

f(x)

Nodo di

OutputNodi di

Input

Nodi Nascos

tiesempio…

Metodi Bayesiani di classificazione

Metodo di Bayes è un metodo di inferenza statistica utilizzato per il calcolo delle probabilità a posteriori.

Questi metodi hanno il vantaggio di giungere a descrizioni razionali anche quando non vi sono abbastanza informazioni.

Esempio Banale - zona di residenza

Esempio Completo -

Esempio di probabilità a posteriori (probabilità a posteriori)

A Londra in inverno piove nel 50% dei casi.

A Londra è nuvoloso nell’80% dei casi

A Londra, quando piove è nuvoloso (100% dei casi)

Oggi a Londra è nuvoloso, che probabilità c’è che stia piovendo?


Regola di Bayes(Teorema di Bayes)

Ci sono 5 probabilità su 8 che a Londra

piova!

Su una linea di produzione abbiamo il 30% di difettosità.A valle della linea abbiamo due metodi per riconoscere la difettosità, questi due sistemi di controllo della difettosità danno risposte sbagliate, uno al 2% e l’altra all’8%.Se la prima delle due verifiche ha riscontrato la difettosità mentre la seconda non l’ha riscontrata.Quale dei due controlli ha dato la risposta corretta?

Applichiamo la formula di Bayes…


Regola di Bayes(Teorema di Bayes)

Documents

Business Intelligence Dai dati alle decisioni. Modulo 5 Customer Profiling e Data Mining Togli la causa e leffetto sparirà. (Miguel De Cervantes)