Upload
ambrogio-silvestri
View
226
Download
0
Embed Size (px)
Citation preview
Business IntelligenceDai dati alle decisioni
Modulo 5Customer Profiling e Data Mining
Togli la causa e l’effetto sparirà. (Miguel De Cervantes)
Customer Profiling
Sistema informativo in grado di fornire, per ogni singolo cliente, un dettaglio del suo comportamento d’acquisto attuale e atteso.
Siamo identificati attraverso la transazione.
BANCA N. CONTOASSICURAZIONE N. POLIZZACASA EDITRICEN.ABBONAMENTOGAS N. CONTATORETELEFONO N. TELEFONO
TRANSAZIONE
Customer Profiling
Avere come obbiettivo il monitoraggio della transazione è un sistema naturale di controllo se vogliamo aumentare l’efficienza della PRODUZIONE e/o DISTRIBUZIONE, ma se l’obbiettivo è riconoscere, soddisfare e mantenere fedele il cliente dobbiamo cambiare punto di vista.
Rapporto personale e sulla relazione.
METODI DI ESPOSIZIONE DEI PRODOTTI
TESSERE FEDELTÀRELAZIONE
Struttura di un sistema di customer profiling
Le informazioni di cui un’azienda può disporre sono descrittive e comportamentali.
Tali informazioni sono solitamente disponibili sui sistemi amministrativi e vanno quindi integrati aumentando l’interattività tra azienda e cliente.
Struttura di un sistema di customer profiling
Persone
Programmi
Premio
Aziende
dati anagraficisocio-economicisocio-demografici settore
dimensionelocalizzazione
comportamento di acquisto
comportamento d’uso
descrittive
descrittive
comportamentali
Struttura di un sistema di customer profiling
Esempio Transazioni in banca.
N. transaz.
Cliente
Conto 1 20 A
Conto 2 5 B
Conto 3 5 C
Conto 4 10 B
Conto 5 5 B
Conto 6 5 B
20 transazione a settimana
10 transazione a settimana
5 transazione a settimana
Focus sul Cliente
B
A
C
Focus sulla
transazione
Struttura di un sistema di customer profiling
Bisogna quindi pensare a degli indici predittivi del comportamento futuro.
Lufthansa Audi Vailant
Indici predittivi
Indice della probabilità di abbandono
Indice del valore attuale netto
Indice della probabilità di frode e morosità
Indice della probabilità di acquisto
- Telefonia
- Quattroruot
e
- Finanziame
nti
- Amazon
Indici predittivi probabilità di
abbandono valore attuale netto probabilità di frode probabilità di acquisto
Tali indici vengono calcolati utilizzando come base il comportamento in un particolare periodo trascorso e applicando degli algoritmi di DATA MINING
DATI STORICI + ESEMPI GIA’ NOTI =
MODELLI PREVISIONALI
Si parte quindi dai dati storici che utilizziamo per trovare indici applicabili ai nuovi dati.
Possiamo così classificare
Direct Marketing
Punti Vendita Venditori
efficacia Customer Services
Agentiper l’effettivo potenziale affidato
Esempio di Customer Profiling
Reddito
Deb
ito
Concediamo il prestito al cliente?debito pagato
debito non pagato
Esempio di Customer Profiling
Dobbiamo cercare un modello (DATA MINING) che mi possa “assistere” alla decisione:
- Media
- Iperpiano
- Iperpiani paralleli
- Clustering
s
If (red < s)Then (“debito non pagato”)
sIf (a red + b red < s)Then (“debito non pagato”)
b
a
(Non Supervisionato)
(Non Supervisionato)
(Supervisionato)
(Supervisionato)
Data MiningSi stima che ogni 1.100 giorni, nel
mondo, raddoppiano le
informazioni memorizzate in
formato elettronico
I dati restano semplici dati finché non
vengono gestiti, ossia organizzati
in maniera significativa
Se da un lato le aziende hanno a
disposizione un’enorme
quantità di dati, dall’altro risulta
sempre più difficile districarsi tra informazioni
rilevanti e superflue.
Il Data Mining si pone come
processo che impiego più
tecniche computerizzate
per l’analisi automatica
e”l’estrazione di conoscenze”
Data Mining
Il DATA MINING si pone come processo di selezione, esplorazione e modellazione di grosse masse di dati, al fine di scoprire strutture, regolarità o relazioni non note a priori, e allo scopo di ottenere un risultato chiaro e utile al proprietario del database.
Le regole statistiche tradizionali di analisi dei dati (ad esempio la regressione) vengono utilizzate per cercare conferma a fatti che l’utente ipotizza o già conosce. Se il database è molto grande non si riesce ad avere una visione completa da cui estrapolare una regolarità e simmetrie.
L’idea è che tali strutture non sfuggano ad una elaborazione automatica.
Tra le tecniche più diffuse troviamo: Clustering Reti Neurali Reti Bayesiane Alberi di decisioni Apprendimento genetico Analisi delle associazioni
Tutte le tecniche comprendo metodi e algoritmi.
Clustering con l’algoritmo k-meansData Mining
Tecniche di Data
Mining
Supervisionate
Reti Neurali
Reti Bayesiane
Alberi di decisioniAnalisi delle
associazioni
Non-Supervision
ateClustering
Clustering con l’algoritmo k-meansData Mining
Clustering (tecnica di Cluster Analysis)
Esempio – Metodo k-means (k-medie)
metodo partizionante
ALGORITMO K-
MEANS
k-clusterrecord
INPUT OUTPUTkfunzione di media metrica
Clustering (tecnica di Cluster Analysis)
1. Scegliere un valore k=numero di cluster da determinare.
2. Scegliere in modo casuale k dati del detaset che saranno i (bari)centri del cluster.
ALGORITMO K-
MEANS
k-clusterrecord
INPUT OUTPUTkfunzione di media metrica
Clustering (tecnica di Cluster Analysis)
3. Definire una metrica per calcolare la distanza dei punti dai centri.
4. Calcolare la media per ogni cluster.
ALGORITMO K-
MEANS
k-clusterrecord
INPUT OUTPUTkfunzione di media metrica
Clustering (tecnica di Cluster Analysis)
5. Se le nuove medie sono identiche a quelle precedenti il processo termina; altrimenti utilizzare le nuove medie come centri dei cluster e ripetere i passi da 3. a 5.
Solitamente si preferisce fermarsi quando siamo arrivati ad un errore quadratico predefinito.
ALGORITMO K-
MEANS
k-clusterrecord
INPUT OUTPUT
Clustering (tecnica di Cluster Analysis)
Esempio su Excel x yA 1 2B 1,5 1C 2 1D 1 1,5E 4 2F 2 4G 5 2H 5 1I 3 4J 0,5 2,5K 4 3L 2 3M 1 4N 1,5 2O 5 4
0 1 2 3 4 5 60
0.5
1
1.5
2
2.5
3
3.5
4
4.5
Algoritmi di Classificazione
Valutati da• Velocità• Robustezza
• Scalabilità• Interoperabilità
Esempi di alberi di classificazione
ALBERO BINARIO ALBERO GENERICO
Accetta Comunicazione
Età Zona di residenza
SI NO ≤45 >45 Nord Centro Sud Isole
Algoritmi di Classificazione
Esempio di rete neurale
Vettore di Input
Vettore di Outputx1
x2
xn-1
xn
…
f(x)
Nodo di
OutputNodi di
Input
Nodi Nascos
tiesempio…
Metodi Bayesiani di classificazione
Metodo di Bayes è un metodo di inferenza statistica utilizzato per il calcolo delle probabilità a posteriori.
Questi metodi hanno il vantaggio di giungere a descrizioni razionali anche quando non vi sono abbastanza informazioni.
Esempio Banale - zona di residenza
Esempio Completo -
Esempio di probabilità a posteriori (probabilità a posteriori)
A Londra in inverno piove nel 50% dei casi.
A Londra è nuvoloso nell’80% dei casi
A Londra, quando piove è nuvoloso (100% dei casi)
Oggi a Londra è nuvoloso, che probabilità c’è che stia piovendo?
Algoritmi di Classificazione
Regola di Bayes(Teorema di Bayes)
Ci sono 5 probabilità su 8 che a Londra
piova!
Su una linea di produzione abbiamo il 30% di difettosità.A valle della linea abbiamo due metodi per riconoscere la difettosità, questi due sistemi di controllo della difettosità danno risposte sbagliate, uno al 2% e l’altra all’8%.Se la prima delle due verifiche ha riscontrato la difettosità mentre la seconda non l’ha riscontrata.Quale dei due controlli ha dato la risposta corretta?
Applichiamo la formula di Bayes…
Algoritmi di Classificazione
Regola di Bayes(Teorema di Bayes)