54
Soft Computing – 55, quai de Grenelle – 75015 Paris – tél. +33 (0)1 73 00 55 00 – www.softcomputing.com Soft Computing Séminaire « Data Mining VS Data Science » Paris, le 05 mars 2015

Du datamining à la datascience

Embed Size (px)

Citation preview

Soft Computing – 55, quai de Grenelle – 75015 Paris – tél. +33 (0)1 73 00 55 00 – www.softcomputing.com

Soft Computing

Séminaire « Data Mining VS Data Science »

Paris, le 05 mars 2015

Comment passer du Data Mining traditionnel à la Data Science ? Quels bénéfices ? Quels impacts ? Quels R.O.I. ?

Séminaire le 05 mars 2015

Du Data Mining à la Data Science

Soft Computing |55 quai de Grenelle|75015 Paris|01 73 00 55 00 | www.softcomputing.com

A propos

Soft Computing est une société spécialisée en CRM, Big Data et Digital, réunissant près de 400 consultants, délivrant des prestations de Conseil, de

Technologie et de Marketing Services.

Soft Computing est coté à Paris dans le compartiment C de NYSE Euronext (ISIN : FR0000075517, Symbole : SFT).

Cet événement est réservé aux clients et prospects Soft Computing. Pour tout autre profil, l'inscription sera soumise à validation.

Agenda : 08h45 – 09h00 : Accueil des participant 09h00 – 11h00 : Séminaire • La donnée et son exploitation : quels enjeux pour les entreprises ? • Data Miner vs Data Scientist : quelles compétences, quelles différences? • Les nouvelles possibilités d'analyse et les méthodologies associées pour quels cas d'utilisation ? • Les retours d'expériences, les compétences requises, délais et ROI. • Conclusion.

Soft Computing vous invite à un séminaire qui abordera les questions suivantes : • Quels impacts sur le quotidien du Data Miner : quelles sont les techniques/outils à maitriser ? • Quelles sont les possibilités et les nouvelles perspectives d'analyse offertes par le Big Data ? • Quels sont les pièges à éviter ?

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 3

SOMMAIRE SOMMAIRE

1. A propos de Soft Computing

2. La donnée et son exploitation : quels enjeux pour les entreprises ?

3. Data Miner vs Data Scientist : quelles compétences, quelles différences ?

4. Les nouvelles possibilités d’analyses et les méthodologies associées : quels cas d’utilisation ?

5. Les retours d’expériences : quelle démarche, le délai, les coûts ?

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 4

Carte d’identité

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 5

Continuum de services

Think Build

Business

IT

Imaginer, bâtir et opérer

des programmes de conquête et de fidélisation cross-canaux, rentables et innovants

Concevoir, développer et déployer

des solutions Digitales, Big Data et CRM performantes, pragmatiques et adaptées

Run

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 6

Extraits de références 2013

Centre de services de

gestion des campagnes

marketing multicanal.

Ecoute et analyse des

sentiments des clients sur

les réseaux sociaux.

Programme relationnel

multi-devices.

Maintien en conditions

opérationnelles et

évolution du SI marketing

on et offline.

Gestion opérationnelle

des plates-formes

analytiques et marketing

ciblé.

Dispositif d’acquisition de

prospects sur tablette en

magasin.

Cadrage, conception et

déploiement d’un service

client pro-actif.

Centre de services de

datamining, de

campagnes ciblées et de

diffusion des reportings.

Personnalisation en temps

réel des contenus et

valorisation d’audience.

Déploiement d’un outil

d’automatisation des

forces de ventes.

Définition d’une stratégie

de Business Intelligence.

Applications mobiles et

personnalisation.

Pilotage de la qualité de

l’expérience client.

Optimisation des parcours

client et du taux de

transformation sur

Internet.

Référentiel client

transversal multicanal et

multiservice.

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 7

Experts reconnus

Enseigner

Ecrire

Echanger

http://blog.softcomputing.com/

https://twitter.com/#!/SoftComputing

http://www.facebook.com/softcomputing

http://www.softcomputing.com/fr/news/

http://fr.slideshare.net/softcomputing

http://www.linkedin.com/company/soft-computing

http://www.viadeo.com/fr/company/soft-computing

https://plus.google.com/+Softcomputing/

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 8

SOMMAIRE SOMMAIRE

1. A propos de Soft Computing

2. La donnée et son exploitation : quels enjeux pour les entreprises ?

3. Data Miner vs Data Scientist : quelles compétences, quelles différences ?

4. Les nouvelles possibilités d’analyses et les méthodologies associées : quels cas d’utilisation ?

5. Les retours d’expériences : quelle démarche, le délai, les coûts ?

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 9

SOMMAIRE SOMMAIRE

Une révolution sous nos yeux

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 10

…devenu en 2010 Digital Dad (ou

mom)

Digital Native né en 1980…

Oui, le client a changé

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 11

Oui, ça s’accélère 8 des 10 premiers sites web ont moins de 10 ans

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 12

Son mode de consommation change

2005 2015

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 13

Son mode d’expression change

2005 2015

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 14

Sa relation à l’annonceur change

2005 2015

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 15

Son univers de choix change

2005 2015

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 16

Facteurs de succès : bouleversés

2005 2015

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 17

SOMMAIRE SOMMAIRE

Quelles conséquences sur le marketing ?

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 18

Dans quels domaines le marketing doit-il concentrer ses investissements ?

Les priorités du marketing changent

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 19

Individualisé

Segment Individu

2005 2015

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 20

Mobile

2005 2015

Portable Multi-device

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 21

Omnicanal

2005 2015

Centré canal et campagne Centré client et expérience

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 22

Contextuel

2005 2015

Ciblé Localisé

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 23

Temps réel

2005 2015

Au jour A la seconde

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 24

Social

2005 2015

Client Influenceur

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 25

Les compétences requises évoluent aussi

Quelles sont les 3 plus importantes compétences d’un directeur marketing

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 26

La donnée au coeur

Données

Création

Social

Web

Marketing

Mobilité

Média

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 27

SOMMAIRE SOMMAIRE

1. A propos de Soft Computing

2. La donnée et son exploitation : quels enjeux pour les entreprises ?

3. Data Miner vs Data Scientist : quelles compétences, quelles différences ?

4. Les nouvelles possibilités d’analyses et les méthodologies associées : quels cas d’utilisation ?

5. Les retours d’expériences : quelle démarche, le délai, les coûts ?

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 28

DATAMINING VS DATA SCIENCE : BIG BANG ?

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 29

Les données analysées

AVANT

Périmètre

Univers de données

Format et stockage

Historique

Plusieurs mois

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 30

Les analyses

AVANT

Segmentation

Valeur, RFM, comportementale, style de consommation, marché, relationnelle,…

Score De prospection, rétention, endormissement, appétence (cross sell , up sell, canaux..), cycle d’achat, valeur future …

Etude d’impact De programme de fidélisation, déréférencement, lancement d’offre, dispositif de Marketing direct

Prévision Prévision de vente, prévision de résiliation, prévision d’appels , durée de vie…

Etude géomarketing Typologies de zone d’implantation , des études d’optimisation des réseaux de points de vente physique….

Fraude Modèles de détection des comportements atypiques

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 31

Les méthodologies

AVANT

Régression logistique

Modèle ARIMA/SARIMA

Analyse des correspondances

multiples

Analyse Factorielle

Analyse en composantes principales

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 32

Les outils

AVANT

Accès aux données

Manipulation de données

Analytics Restitution

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 33

L’organisation des projets et les charges

AVANT

Définition de la démarche

et des indicateurs

Extraction des données

Construction de la matrice

d’études

Analyse/ Modélisation

Présentation des résultats

2 jours 5 jours 10 jours 15 jours 10 jours

Exemple pour la mise en place d’une segmentation :

= 42 jours

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 34

Les compétences attendues pour un Datamininer

Maitrise des outils Maitrise des méthodes Sens Business

AVANT

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 35

Quelles évolutions/ Quels impacts avec l’arrivée du Big Data ?

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 36

Au démarrage du Big data

• Des données brutes / non structurées • Accès/manipulation de données via Impala, Hive

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 37

Big data 2014

Démocratisation

Big data 2015

Démocratisation

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 38

Les données analysées

2015

Périmètre clients

Univers de données

Format et stockage

Historique

Plusieurs années

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 39

Les nouvelles analyses

2015

Analyse de parcours web

Analyse de sentiments

Segmentation multicanal

Segmentation Style de

consommation

Scores à la volée

Moteur de recommandations

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 40

Les nouvelles méthodologies utilisées

2015

Random Forest

Boosting Gradient Machine

Textmining

Réseau Bayesien

ACP avec rotation

Sequential Pattern Analysis

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 41

Les outils

2015

Accès aux données

Manipulation de données

Analytics Restitution

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 42

L’organisation des projets et les charges

2015

Exemple pour la mise en place d’une segmentation :

Définition de la démarche

et des indicateurs

Extraction des données

Construction de la matrice

d’études

Analyse/ Modélisation

Présentation des résultats

2 jours 3 jours 6 jours 8 jours 3 jours = 22 jours

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 43

Les compétences attendues pour un Data Scientist

Maitrise des outils Maitrise des nouvelles méthodes

Sens Business

Maintenant

GESTION DE PROJET

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 44

SOMMAIRE SOMMAIRE

1. A propos de Soft Computing

2. La donnée et son exploitation : quels enjeux pour les entreprises ?

3. Data Miner vs Data Scientist : quelles compétences, quelles différences ?

4. Les nouvelles possibilités d’analyses et les méthodologies associées : quels cas d’utilisation ?

5. Les retours d’expériences : quelle démarche, le délai, les coûts ?

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 45

Un nouvel environnement

Données Web/ SC

Données exogènes

Données non structurées

Importante volumétrie de

données

Plus de contrainte de

stockage

Temps réel

Nouvelles méthodes

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 46

Les nouveaux besoins d’analyse

Améliorer la performance de

détection avec des données exogènes

Proposer des produits de substitution

Améliorer la performance de

détection et les temps de traitement avec de nouvelles méthodes

Analyser les sentiments

Identifier les influenceurs

Appréhender les styles de consommation

Identifier et optimiser les parcours Web

… …

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 47

SOMMAIRE SOMMAIRE

1. A propos de Soft Computing

2. La donnée et son exploitation : quels enjeux pour les entreprises ?

3. Data Miner vs Data Scientist : quelles compétences, quelles différences ?

4. Les nouvelles possibilités d’analyses et les méthodologies associées : quels cas d’utilisation ?

5. Les retours d’expériences : quelle démarche, le délai, les coûts ?

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 48

Données :

Digitales CRM

Penser applications opérationnelles et débuter simple

R.O.I.

Connaissance

Productivité opérationnelle

Analyses ad’hoc

Vision produit Vision clients

Technologies

1

2

3

4

Datamining Réconciliation

Externes

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 49

Une démarche itérative et cocréative

• Une approche pour :

– Identifier vos enjeux et vos besoins et les décliner en plan d’expérimentation,

– Benchmarker, tester et valoriser la création de valeur

– Préparer une éventuelle industrialisation

Mettre en œuvre la plateforme 2

Présentation, ajustement , validation de l’apport de

valeur, plans test 3

Représentants métiers

Définition des cas d’usages

Réaliser les cas d’usage métiers et benchmark avt

- après

4

1

Représentants métiers / SI

Recueil de l’existant et des besoins métier et SI

Représentants métiers

Recommandation et plans d’actions en vu de l’industrialisation 5

2

Décile

Lift

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 50

Architecture de travail

Lab data Large Data Fast Data

Prototyper l’algorithme

Produire les résultats

Suivre et optimiser la performance de

l’algorithme

Proposer les résultats

Intégrer l’algorithme

Développer l’algorithme

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 51

Planning et contributeurs

Run

Initialisation du centre de services

Conception et réalisation « large »

Maintenance

Monitoring applications

Administration

Gestion des projets de setup

Gestion du centre de services Program Management

Gestion des projets d’évolutions

Busin

ess

IT

Gestion d

e p

roje

t et

de s

erv

ices

Setup

Sprints algorithme sur le « lab »

Mise en place architecture

Définition du SLA

Conception et réalisation « fast »

Tests

Sprints d’amélioration algorithme sur le « lab »

Surveillance de la santé de l’algorithme « lab »

Infr

a

Hard & soft

Hébergement et monitoring

Data exploration

M1 M2 M3 M4 M5

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 52

Surement pas seul

Marketing Datascience Programmation

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 53

Combien ça coûte ?

X*100 K€ / an Batch As a service

X* 1 M€ / an Industrialisation Temps réel Datawahouse+big data

www.softcomputing.com Reproduction interdite sans l’accord écrit de Soft Computing 10/03/2015 54

Offre de services

S ensibilisation

tratégie

andbox

R oadmap

ollout

un