21
Advanced Quantitative Methods Course Assignment: Analisi di Segmentazione Classica “CasoLat” Gruppo “XYZ” Milano, 11 Maggio 2010 Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini

Assignment Advance Quantitative Methods Casolat

  • Upload
    lanuz

  • View
    639

  • Download
    2

Embed Size (px)

Citation preview

Page 1: Assignment Advance Quantitative Methods   Casolat

Advanced Quantitative Methods Course

Assignment:

Analisi di Segmentazione Classica “CasoLat”

Gruppo “XYZ”

Milano, 11 Maggio 2010

Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini

Page 2: Assignment Advance Quantitative Methods   Casolat

1. Obiettivo dell’analisi di segmentazione classica e descrizione del set di dati considerati (CasoLat);

2. Analisi preliminare e statistica descrittiva;

3. Analisi fattoriale (per l’individuazione di tali macro-elementi);

4. Analisi Cluster (per l’individuazione dei diversi segmenti).

Indice

Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini

5. Conclusioni;

Page 3: Assignment Advance Quantitative Methods   Casolat

1. Obiettivo dell’analisi di segmentazione classica e descrizione del set di dati considerati (CasoLat);

Il database “dati_Casolat” è relativo ad una ricerca di mercato legata alla percezione ed alla valutazione - attraverso 17 item – del“latte Casolat”.

Casolat è un latte scremato fresco da lanciare sul mercato italiano e l’azienda vuole individuare e studiare i segmenti più profittevoli peradottare un’adeguata comunicazione. L’indagine comprende una parte relativa alla valutazione di diverse motivazioni d’acquisto per un lattefresco. Gli item da valutare su una scala di importanza soggettiva da 1 a 9 (1 poco importante—9 molto importante) sono i seguenti:

1. È un latte molto buono, gustoso;2. E’ un latte che mi dà energia;3. E’ un latte genuino, naturale;4. E’ un latte che fa bene alla salute;5. E’ un latte di qualità superiore;6. E’ un latte dissetante;7. E’ adatto ai bambini;

2

7. E’ adatto ai bambini;8. E’ sicuro e controllato;9. Ha un buon rapporto qualità/ prezzo;10. E’ facile da digerire;11. E’ un latte leggero, poco calorico;12. E’ un latte fresco;13. Ha una funzione depuratrice dell’organismo;14. E’ un latte per tutta la famiglia;15. E’ un latte ideale per la preparazione di alimenti;16. E’ un latte che mi fa sentire in forma;17. E’ un latte che mi sazia;

Oltre a tali variabili nel database sono presenti anche alcuni elementi utili per la descrizione dei profili/segmenti da individuare in modo daverificarne l’effettiva raggiungibilità per indirizzare la comunicazione in modo adeguato.

Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini

Page 4: Assignment Advance Quantitative Methods   Casolat

1. Obiettivo dell’analisi di segmentazione classica e descrizione del set di dati considerati (CasoLat);

Con l’analisi di segmentazione classica sintetizzeremo il database della ricerca di mercato a nostra disposizione in macro-elementi discelta del consumatore su una serie di caratteristiche del latte (17 items di partenza: motivazioni/occasioni d’uso o modalità di comportamento)e successivamente individueremo e costruiremo gruppi omogenei del target rilevante di clienti sulla base dei macro-elementi individuati.

L’analisi di segmentazione classica prevede, quindi, la combinazione di due modelli statistici multivariati:

• Una analisi fattoriale analisi fattoriale (per l’individuazione di tali macro-elementi);

• Una cluster analysis (per l’individuazione dei diversi segmenti).

Obiettivo di tale analisi è quello di focalizzare le campagne marketing dell’azienda in funzione degli specifici bisogni dei cluster di potenziali clienti individuati.

3Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini

Domande:

a) Si individui e si valuti un modello di analisi fattoriale e si dia un’interpretazione delle componenti principali (o fattori) individuate attraverso l’analisi;

b) Si individui e si analizzi un modello di cluster analysis applicato sulla base dei macro-elementi individuati nella parte precedente costruendo gruppi omogenei del target rilevante e si dia un’interpretazione dei cluster ottenuti;

c) Si approfondisca l’analisi precedente con i profili socio-demografici dei diversi segmenti ottenuti incrociando l’appartenenza ai cluster con alcune caratteristiche socio-demografiche/anagrafiche del target per verificarne l’effettiva raggiungibilità;

Page 5: Assignment Advance Quantitative Methods   Casolat

2. Analisi preliminare e statistica descrittiva: statistica univariata

Prima di cominciare con l’analisi del caso, eliminiamo dal database le osservazioni caratterizzate dalla presenza di dati mancanti (attribuzione del valore 0 ad alcuni attributi dell’intervista); le osservazioni passano da 1001 a 906 con un decremento, ritenuto da noi accettabile, del 9,4%.

Identifichiamo le caratteristiche fondamentali della distribuzione di ogni singola variabile senza analizzare per il momento le relazioni congiunte con le altre variabili.

4Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini

con le altre variabili.

Le statistiche univariate sui 17 item evidenziano:

- valori medi molto elevati: sempre > 6,86;- distribuzioni polarizzate verso valori alti con valori massimi e quartili di ordine 75 sempre coincidenti

Page 6: Assignment Advance Quantitative Methods   Casolat

2. Analisi preliminare e statistica descrittiva

L’analisi fattoriale studia le interrelazioni tra variabili al fine di trovarne un nuovo insieme, di dimensioni minori rispetto all’originario, che esprimaciò che è in comune fra le variabili originarie stesse.Dal punto di vista statistico, obiettivo dell’analisi fattoriale è individuare un numero ridotto di combinazioni lineari delle variabili originarie,fattori, che spieghino gran parte della varianza delle variabili stesse. Ogni combinazione lineare sarà funzione di tutte le variabili originarie,correlandosi in particolare ad alcune di esse. Le componenti saranno non correlate tra di loro.L’input effettivo della tecnica è costituito dalla matrice di correlazione tra le variabili; più forte è la correlazione, maggiore sarà la capacità disintesi dell’analisi fattoriale. Dallo studio della matrice e del relativo diagramma di dispersione si potrà dunque cogliere la natura e l’intensità deilegami tra le singole coppie di variabili.

5Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini

La presenza di correlazioni importanti tra alcuni attributi (valori > 0,5 per esempio tra “sentirsi in forma” e “mi da energia”, tra “mi da energia “ e“mi sazia”, tra “è sicuro e controllato” e “è genuino e naturale”…) permette di ipotizzare fin dalle fasi di analisi preliminare un correttofunzionamento del modello di analisi fattoriale.

Page 7: Assignment Advance Quantitative Methods   Casolat

3. Analisi fattoriale (P.C.A.)

JMP: Multivariate ���� Principal Components ���� On Correlations

Applichiamo l’algoritmo di analisi fattoriale sulle 17 variabili iniziali al fine di stabilire:- Il numero di fattori da considerare;

- la varianza spiegata dai fattori di sintesi;

- l’interpretabilità del modello.

La colonna “percent” riporta la % di varianza spiegata da ciascuna delle nuove componentiindividuate dal modello. Il primo fattore (e’ un latte molto buono, gustoso) è quello convarianza spiegata massimo (39.462%), il secondo fattore è quello con varianza spiegatasecond best (7.251%) e così via in ordine decrescente.Al fine di determinare il numero di fattori da considerare per ridurre la complessità delmodello, è utile considerare che una percentuale del 60-70% della varianza spiegata è daritenersi generalmente accettabile.

6Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini

ritenersi generalmente accettabile.Nel nostro caso, 7 fattori spiegherebbero il 70,5% della varianza, 6 fattori il 66,58%.

Al fine di determinare il numero ottimale di fattori, puo’ risultare di supporto anche unainterpretazione del grafico degli auto valori (Scree Plot); in particolare il grafico evidenziacome in corrispondenza di un appiattimento della curva, un aumento di fattori noncomporta significativi incrementi della varianza spiegata.Nel nostro caso (eccezion fatta per il passaggio Da 1 a 2 fattori) si riscontrano 2 cambi dipendenza: uno, più significativo, tra i fattori 6-7 ed un altro tra 11-12. Considerando ilnotevole aumento di complessita’ che comporterebbe utilizzare 11 fattori invece di 7 (afronte di un aumento di varianza spiegata di soli 14.1%) assumiamo di utilizzare 7 fattori.In ogni caso, le considerazioni relative alla percentuale di varianza spiegata ed allariduzione di complessità vanno unite, per la scelta del corretto numero di fattori di unaanalisi di taglio marketing sull’effettiva interpretabilità dei fattori e sulla loro potenzialerilevanza per l’impostazione delle politiche di marketing.

Page 8: Assignment Advance Quantitative Methods   Casolat

3. Analisi fattoriale (P.C.A.)

JMP: Principal Components/Factor Analysis ���� Factor Rotation

Factoring Method:Principal Components (diagonals=1)How many rotated factors? 7Rotation Method ‘Varimax’

Esistono infiniti output di analisi fattoriale compatibili con gli stessi dati diinput. Questi infiniti output in generale non forniscono interpretazioni delfenomeno pesantemente contrastanti tra di loro, ma differiscono solomarginalmente e nelle aree di ambiguità.Tra gli infiniti output è opportuno pertanto scegliere quelli che meglio mettonoin evidenza le correlazioni tra variabili e fattori. Il metodo di rotazione Varimaxha come obiettivo la minimizzazione del numero di variabili che possiedonosaturazioni elevate per ciascun fattore.

7Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini

L’applicazione della rotazione Varimax, pertanto, mantiene inalterata lavarianza complessiva spiegata dall’insieme dei fattori, 70,54%, ma modifica,massimizzandola, la percentuale di varianza spiegata da ciascun fattore (a titolodi esempio il fattore 1 spiegava da solo il 39,46% della varianza prima dellarotazione e risultava correlato con la maggior parte degli item; a seguito dirotazione il fattore 1 passa al 17,65%, la % di varianza rimanente viene“spalmata” sui restanti fattori ed aumenta l’interpretabilità degli altri fattori ).

Page 9: Assignment Advance Quantitative Methods   Casolat

3. Analisi fattoriale (P.C.A.)

E’ importante inoltre verificare la comunabilità dei fattori, e quindi verificare quale sia la% di varianza spiegata di ogni singolo attributo di partenza.

Nel caso in analisi si evidenzia come le singole variabili vengano spiegate con % chevariano da un minimo del 55,3% (funzione depuratrice dell’organismo) ad un massimodel 95% (è un latte dissettante) per un valore medio che si attesta sul 70,5%.

In sintesi, la complessità è stata ridotta circa del 60% (da 17 variabili a 7 fattori), la % di varianza spiegata è del 70.54% (con una perdita accettabili del 29.458%), la comunalità è sempre superiore al 55.3% (funzione depuratrice dell’organismo).

Una eventuale riduzione dei fattori (6 vs 7) comporterebbe sicuramente unadiminuzione della complessità ma a fronte di una diminuzione della varianza spiegatacomplessivamente (da 70,54% a 66,5%) ed in particolare per specifiche variabili (è unlatte dissetante passerebbe dal 95% al 60%). Decidiamo, in ottica marketing, di non

8Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini

latte dissetante passerebbe dal 95% al 60%). Decidiamo, in ottica marketing, di nonperdere tale dettaglio e di continuare con 7 fattori.

Analizziamo dunque come si comporta il modello a livello di l’interpretabilità

analizzando “la matrice dei fattori ruotata”.

JMP: Factor Rotation: Varimax

Page 10: Assignment Advance Quantitative Methods   Casolat

3. Analisi fattoriale (P.C.A.)

Al fine di analizzare l’interpretabilità del modello, verifichiamo i valori assunti dalle singole celle della matrice dei fattori ruotata che evidenziano la correlazione di ciascuna delle 17 variabili di partenza ai 7 fattori considerati rappresentati nelle colonne della matrice.Quanto più forte è la correlazione, tanto più la singola variabile caratterizzerà i fattori ottenuti.Ogni singolo fattore è infatti ottenuto come combinazione lineare di tutte le variabili di partenza per come qui di seguito riportato:

F1= b1X + b2X + b3X + ………….+ b14X (questo per tutti i fattori)

Prendiamo la matrice dei fattori ruotata e la copiamo in excel. Per trovare/evidenziare le correlazioni forti, evidenzio la matrice dei valori, poi Home�Formattazione condizionale�Scala di colori.

L’analisi della matrice ci permette dunque di meglio caratterizzare i singoli fattori e di “battezzarli” a seconda delle peculiari caratteristiche.

Rotated Factor Pattern

GUSTO FRESCHEZZAPER I GRANDI E

PER I PICCINIDIGERIBILITA’ LEGGEREZZA CONVENIENZA

POTERE DISSETANTE

1 È un latte molto buono, gustoso 0,585802 0,350436 0,2046678 -0,090928 0,1499449 0,2731628 -0,058654

9Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini

1 È un latte molto buono, gustoso 0,585802 0,350436 0,2046678 -0,090928 0,1499449 0,2731628 -0,058654

2 E’ un latte che mi dà energia 0,744176 0,2256356 0,1760879 0,228521 -0,02402 0,083899 0,1073991

3 E’ un latte genuino, naturale 0,2695219 0,6747949 0,1856965 0,1700758 -0,008683 0,237591 0,0667702

4 E’ un latte che fa bene alla salute 0,4765888 0,3644414 0,2826577 0,2876339 0,2552452 0,0101203 -0,03568

5 E’ un latte di qualità superiore 0,352554 0,5270681 0,3143145 0,0441598 0,1952893 0,1271387 0,0883555

6 E’ un latte dissetante 0,2665588 0,1394061 0,089494 0,1115818 0,0966336 0,09657 0,9062882

7 E’ adatto ai bambini 0,2069754 0,327477 0,7370665 0,1483316 -0,114879 0,0365657 -0,022089

8 E’ sicuro e controllato 0,0716118 0,6388794 0,0270259 0,2552731 0,0406213 0,3953705 0,0669589

9 Ha un buon rapporto qualità/ prezzo 0,1350408 0,1599217 0,1041501 0,0653479 0,1343099 0,8817457 0,0857505

10 E’ facile da digerire 0,1515711 0,2648915 0,0954717 0,7898668 0,2247989 0,0700023 0,0985593

11 E’ un latte leggero, poco calorico 0,1811885 0,1659001 0,0243135 0,2826399 0,813613 0,1583432 0,0799922

12 E’ un latte fresco 0,145896 0,7724745 0,1041005 0,0499222 0,1749021 -0,097142 0,0789353

13 Ha una funzione depuratrice dell’organismo 0,5393826 0,3080208 0,2004226 0,251261 0,019158 0,169298 0,1868149

14 E’ un latte per tutta la famiglia 0,1927008 0,1739135 0,664877 -0,141228 0,4725455 0,0593632 0,1554397

15 E’ un latte ideale per la preparazione di alimenti 0,3657103 -0,060397 0,5631874 0,3833849 0,0558926 0,2221196 0,1430545

16 E’ un latte che mi fa sentire in forma 0,5977278 0,1908682 0,2327479 0,3210368 0,2715298 0,0864465 0,1256479

17 E’ un latte che mi sazia 0,8044785 0,0340663 0,0790655 -0,050381 0,1329641 -0,010319 0,2079367

Page 11: Assignment Advance Quantitative Methods   Casolat

3. Analisi fattoriale (P.C.A.)

L’analisi della matrice ci permette di escludere fenomeni di cross-loading. Non sembrano esistere infatti attributi fortemente correlati atutti i fattori individuati.Riteniamo dunque che i fattori individuati possano essere considerati come pilastri nel nostro modello (tali pilastri sono tra loro noncorrelati ed indipendenti; ciascuno di essi, dunque, con media 0 e varianza 1).

10Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini

Page 12: Assignment Advance Quantitative Methods   Casolat

4. Analisi Cluster

I 7 fattori individuati costituiscono la base di partenza della cluster analysis.La cluster analysis è una tecnica di classificazione automatica in gruppi, omogenei internamente e disomogenei esternamente, finalizzata all’identificazione di gruppi di entità (nel nostro caso persone) che condividano determinate caratteristiche (benefici ricercati nel prodotto, attitudini, preferenze…)

Nel caso in analisi utilizzeremo una segmentazione per omogeneità (Cluster Diretta, Algoritmo Kmedie).

Obiettivo dell’analisi sarà dunque:

• Definire il numero di cluster attraverso l’algortimo iterativo delle Kmedia;

• Verificare la compattezza interna di ciascun cluster;

• Verificare la respingenza esterna di ciascun cluster;

11Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini

• Verificare la respingenza esterna di ciascun cluster;

• Interpretare e descrivere i cluster (interpretabilità dei cluster).

Page 13: Assignment Advance Quantitative Methods   Casolat

4. Analisi Cluster: a)Ampiezza del Cluster

Steps per valutare un buon modello: quanti cluster scelgo?

�1 Ampiezza Cluster Regola operativa: evitare cluster < 1-3% oppure > 50-60% dei dati

�2 Omogeneità -> Anova Test F�3 Interpretabilità

JMP: Analyse ���� Multivariate Methods ���� Cluster Y: metto i 7 Fattori Options: cambio da ‘Hyrarchical’ a ‘Kmeans’

Number of clusters: primo tentativo con K= 3

Standardize data: YES

� Iterative Clustering � Control Panel Number of clusters: 3.

Dopo un determinato numero di iterazioni (46), l’algoritmo converge a soluzione. Un’analisi dei cluster ottenuti evidenzia una ampiezza eccessiva del cluster 3 (519 individui pari al 57,3% del campione).

12

individui pari al 57,3% del campione).Decidiamo di aumentare il numero di cluster fino ad un numero massimo di 6 e di rilanciare ogni volta l’algoritmo.I risultati evidenziano la presenza di un “Gruppo unico” all’interno dei cluster considerati. La sua ampiezza non tende a diminuire e rimane pressoché costante all’aumentare del numero di cluster.Per prodotti mass-market (quali il latte) è normale trovare un cluster particolarmente consistente, di massa e dunque di difficile caratterizzazione.La scelta ottimale nel nostro caso sembra essere quella di considerare 4 cluster (“cluster 2” in jmp). Un primo tentativo a 5 cluster (“cluster 1” in jmp) aveva dato problemi in fase di interpetabilità.

35,0%

40,0%

45,0%

50,0%

55,0%

60,0%

3 4 5 6Numero clusters

numerosità (% su totale) del cluster più ampio

Page 14: Assignment Advance Quantitative Methods   Casolat

4. Analisi Cluster: b) Omogeneità interna e respingenza esterna

Al fine di verificare l’omogeneità interna e la respingenza esterna dei singoli clustereffettuiamo il test Anova- test F.

Il Test F è determinato dal rapporto tra la varianza tra i gruppi e la varianza neigruppi. Una soluzione di cluster analysis è accettabile quando tutte le variabilimostrano un test F significativo.

La soluzione ottima comporta che ogni singolo fattore sia massimamente diversonei cluster. Vogliamo dunque verificare che, per ogni fattore, sia alta la varianza tra igruppi e sia bassa la varianza nei gruppi (vogliamo cioè che ogni singolo cluster siacostituito da persone con attitudini di consumo simili).

I risultati dell’analisi condotta mostrano, per ogni fattore, prob >F < 0,0001, p-value dunque sempre < 5% e rapporto Test F sempre elevato e significativo.

13Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini

dunque sempre < 5% e rapporto Test F sempre elevato e significativo.

L’interpretazione dei dati statistici evidenzia dunque come i cluster determinati rispettano sia le condizioni di respingenza esterna (diversità tra i cluster, σ2 tra i gruppi ALTA) che quelle di compattezza interna (omogeneità all’interno dei cluster, σ2 nei i gruppi BASSA).

Page 15: Assignment Advance Quantitative Methods   Casolat

4. Analisi Cluster: b) Omogeneità interna e respingenza esterna

14Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini

Tutti i fattori sono standardizzati (e quindi hanno media nulla e varianza uguale a 1). Se le medie non si sovrappongono, i cluster sono massimamentedifferenziati in termini di un certo attributo. Verifichiamo che per ogni fattore il test F (F Ratio) sia significativo e che i p-value < 5% per tutti i fattori. Perverificare la significatività statistica, si può anche analizzare la rappresentazione grafica dell’intervallo di confidenza. Nel nostro caso entrambe lecondizioni sono rispettate.

Page 16: Assignment Advance Quantitative Methods   Casolat

4 Analisi Cluster: b) Omogeneità interna e respingenza esterna

15Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini

E’ importante inoltre verificare la “leggibilità marketing” dei cluster stessi. A tal fine, tanto maggiori saranno i valori assunti dalle medie dei singoli cluster nei confronti dei differenti fattori, quanto maggiore sarà l’importanza di un fattore per lo specifico cluster considerato.

A titolo esemplificativo, la media di 0,316 del cluster 1 nei confronti del fattore “gusto” implica che il cluster 1 assegni importanza elevata a tale fattore. Viceversa il cluster 1 non assegna rilevante importanza al fattore “dietetico” (media del -0,51).

La matrice delle medie dei cluster sintetizza tali valori ed è di importante applicazione al fine di meglio descrivere ed interpretare i singoli cluster.

Page 17: Assignment Advance Quantitative Methods   Casolat

4. Analisi Cluster: c) Interpretabilita’

Esportando la matrice delle medie dei cluster in excel (cluster 2 nel file jmp), è possibile analizzare i valori medi assunti dai singoli fattori rispetto ai differenti cluster (analisi per colonna) evidenziando i valori maggiormente rilevanti..L’interpretazione dei singoli cluster verrà in seguito effettuata leggendo riga per riga quali siano i fattori

Buongustaio Esigente

Price oriented Indifferente

Cluster NUMEROSITA' GUSTO FRESCHEZZAPER I GRANDI E

PER I PICCINIDIGERIBILITA' LEGGEREZZA CONVENIENZA

POTERE

DISSETANTE

Denominazione

Cluster

1 218 0,316 -0,046 0,212 -0,882 -0,514 -0,674 -0,101 Buongustaio

2 129 -1,438 0,559 0,311 0,310 0,345 -0,299 -0,499 Esigente

3 110 -0,370 -1,025 -1,732 0,225 -0,090 0,136 -0,130 Price-oriented

4 449 0,350 0,112 0,230 0,285 0,175 0,381 0,223 Indifferente

16Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini

L’interpretazione dei singoli cluster verrà in seguito effettuata leggendo riga per riga quali siano i fattori più rilevanti; tale analisi ci permetterà quindi di descrivere e denominare i 4 cluster.

� Buongustaio (24,1%): focalizzato sul sapore, sul gusto del prodotto; beve il latte perché gli piace e, probabilmente, ne fa un uso principalmente a colazione (e per questo vuole che il latte lo sazi e gli dia energia);

� Esigente (14,2%): molto attento alla qualità del prodotto, alla sua freschezza, alla leggerezza ed alla digeribilità (qualità per le quali è disposto a sacrificare il gusto); lo utilizza abitualmente in famiglia (per la preparazione di alimenti, per i bambini…);

�Price oriented (12,1%): focalizzato sulla convenienza del prodotto, poco influenzato dalla qualità del prodotto.

�Indifferente (49,6%): cluster molto omogeneo difficile da caratterizzare.

E’ interessante evidenziare inoltre come uno dei fattori da noi considerati, “dissetante”, non risulti caratterizzare in particolare nessuno dei cluster determinati (assume importanza solo relativamente al cluster “indifferente”).

24%

14%

12%

50%

Price oriented Indifferente

Page 18: Assignment Advance Quantitative Methods   Casolat

4. Analisi Cluster: c) Interpretabilita’

E’ interessante inoltre comprendere i profili socio-demografica degli appartenenti ai singoli cluster.In particolare, attraverso una analisi di contingenza, è necessario verificare se esiste relazione significativa tra i cluster identificati e le ulteriori variabili descrittive presenti nel database (pack preferito, frequenza di consumo latte fresco, genere, eta’, figli, titolo di studio, shopping online, pratica abitualmente lo sport, legge quotidiani, quotidiano preferito, regione).Nello specifico, 5 attributi socio-demografici risultano significativi (prob>chiQ < 0,05) per i 4 cluster identificati.

• Genere (uomo, donna);• Ha figli (si, no);• Professione (studente, pensionato, operaio, libero professionista, insegnante, impiegato, casalinga, altro);• Titolo di studio (scuola media inferiore, licenza elementare, laurea, diploma di scuola media superiore);• Pratica abitualmente sport (si, no).

Il test di Pearson sull’attributo “età per classi” ha una prob> chiQu = 0,06 che interpretiamo, con un po’ di flessibilità, come significativa (il

17Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini

valore è infatti prossimo allo 0,05; gli attributi scartati evidenziano invece sempre prob>chiQu> 0,12).

• Età (per classi): 18-30, 31-40, 41- 50, 51-60, 61-70.

Page 19: Assignment Advance Quantitative Methods   Casolat

4. Analisi Cluster: c) Interpretabilita’

18Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini

Page 20: Assignment Advance Quantitative Methods   Casolat

4. Analisi Cluster: chi compone i cluster

BUONGUSTAIO ESIGENTE PRICE - ORIENTED INDIFFERENTE

Genere72,5 % donne27,5 % uomini

66,6 % donne33,4 % uomini

65,4 % donne34,6 % uomini

76,3 % donne23,7 % uomini

Età (classe)

Molto frammentata.Le fasce 18-30 (24,7%) e 41-50 (23%) sono le più

rappresentate.

La fascia da 18-40 rappresenta

complessivamente il 47%

Le fasce 18-30 (25,45%) e 61-70 (24,55%) sono le

più rappresentate.

Le fasce 31-40 (20,27%),41-50 (23,16%) e 61-70

(22,27%) sono le più rappresentate.

19Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini

Figli65% si 60,47% si 44,5% si 64,37% si

Professione (prime 4)

impiegato: 25,2%casalinga: 22%

pensionato: 13,8%studente: 11,9%

impiegato: 27,9%pensionato: 17,8%casalinga: 14,7%studente: 13,2%

impiegato: 20,9%pensionato: 19,1%casalinga: 13,6%

Libero professionista: 12,7%

casalinga: 30,3%impiegato: 23,2%

pensionato: 14,2%studente: 7,6%

Titolo di studio (primi 2)scuola sup.: 51%scuola inf.: 23%

scuola sup.: 48%laurea:31,8%

scuola sup.: 49%laurea:27%

scuola sup.: 46%scuola inf.: 27%

Sport abitualmente 51,8% si 47,3% si 56,36% si 39,87% si

Page 21: Assignment Advance Quantitative Methods   Casolat

5. Conclusioni – strategie di marketing

�Buongustaio (24,1%):

-Prevalentemente donna, impiegata o casalinga con figli, sotto i 50anni, istruzione media.- Ama il latte saporito, lo beve perché le piace, vuole che sia energeticoe nutriente per cominciare bene la giornata.- Advertising consigliato: il latte scremato non possiede lecaratteristiche giuste per questo cluster di consumatori (è un lattemagro e non saporito, adatto a chi soffre di colesterolo, a chi seguediete ipocaloriche etc)

� Esigente (14,2%):

-Prevalentemente donna (ma sale la percentuale di uomini rispetto alcluster precedente), con figli, sotto i 40 anni, istruzione medio-alta.

20Edgardo Calvaresi, Giancarlo Chetta, Maddalena Citterio, Andrea Lanuzza, Moreno Perugini

cluster precedente), con figli, sotto i 40 anni, istruzione medio-alta.- molto attento alla qualità del prodotto, alla sua freschezza, allaleggerezza ed alla digeribilità (qualità per le quali è disposto asacrificare il gusto); lo utilizza abitualmente in famiglia (per lapreparazione di alimenti, per i bambini…).- Advertising consigliato: escluderemmo campagne mkt troppofocalizzate su famiglie con bambini piccoli (il latte scremato infatti nonè molto nutriente), ci focalizzeremmo su campagne tipo “vita snella”,“cereali special K”. Il cliente esigente è inoltre disposto a pagarepremium price e dunque va considerato come cluster di clientiprofittevoli.

�Price oriented (12,1%): è poco influenzato dalla caratteristiche delprodotto; suggeriamo pertanto di non investire in campagne marketingin quanto cluster di clienti sicuramente non profittevole.