24
Utilisation de données et techniques de modélisation innovantes pour l’optimisation de la Fraude et du recouvrement 27 Septembre 2016 Wim Heirman

Utilisation de données et techniques de modélisation ... · arrêté la voiture sous le pont pour vérifier ma roue. Et alors, tout d’un coup, deux hommes ... Solution Avantages

  • Upload
    ngocong

  • View
    214

  • Download
    0

Embed Size (px)

Citation preview

Utilisation de données et techniques de modélisation innovantes pour l’optimisation de la Fraude et du recouvrement

27 Septembre 2016

Wim Heirman

2©2016 Experian Limited. All rights reserved.

Experian Restricted.

We’re a leading global information services company…

In a faster, more complex world, our data and analytics help people and organisations protect, manage and make the most of their data.

Revenue

US$4.8 bnEBIT

US$1.3 bnMarket Cap*

c. £12bn – UK FTSE Top 50

Employees

c.17,000Offices in

39 countries

Largest markets

US, Brazil, UK

3©2016 Experian Limited. All rights reserved.

Experian Restricted.

We help our clients at every stage of the customer journey with our unique capabilities in…

Analytics

Software

Consulting

4©2016 Experian Limited. All rights reserved.

Experian Restricted.

Plus de 90% des données dans le monde ont été créées ces 2 dernières années….

Eric SchmidtExecutive chairman of Google's new parent company, Alphabet.

“Chaque 2 jours, nous créons autant d’information que dans la période

du début de humanité à 2003”

5©2016 Experian Limited. All rights reserved.

Experian Restricted.

Big Data Analytics Quelques cas d’usage chez Experian

Voice of Customer Analytics

Traduire des conversations téléphoniques en

modèles prédictifs

Transactional Data Insights

KYC (Know Your Customer) au niveau

transactionnel

Social Network Analytics

Identifier les personnes influentes et importantes à

connaitre par vous

6©2016 Experian Limited. All rights reserved.

Experian Restricted.

Voice of Customer Analytics

Traduire des conversations téléphoniques en

modèles prédictifs

Transactional Data Insights

KYC (Know Your Customer) au niveau

transactionnel

Social Network Analytics

Identifier les personnes influentes et importantes à

connaitre pour vous

Big Data Analytics Quelques cas d’usage chez Experian

7©2016 Experian Limited. All rights reserved.

Experian Restricted.

Voice of Customer AnalyticsTraduire des conversations téléphoniques en modèles prédictifs

Les appels téléphoniques des centres de contact ou

de recouvrement contiennent des informations

cruciales sur le comportement de vos clients

…et nous avons la capacité de traduire cette

information en texte puis d’utiliser des techniques

de machine learning pour identifier les mots clés

8©2016 Experian Limited. All rights reserved.

Experian Restricted.

Voice of Customer AnalyticsBusiness applications

Prévoyez le risque

Efficacité et Dynamisme

Intégrez l’axe vocale dans l’analyse

de la performance de l’équipe de

recouvrement

Surveillez et contrôlez la

conformité et la qualité des

appels

Recouvrement

Identification de

prospectsCross selling

Up sellingEvaluation du

centre d’appel

Réduire l’attrition

Détection de

fraude Empêchez/détectez les

fraudes dans les sinistres

d'Assurance

Connaissance

Client

Empêchez/détectez les

fraudes dans le centre

d’appel

9©2016 Experian Limited. All rights reserved.

Experian Restricted.

Enregistrement

des appels

Transformation

en texteDéveloppement

modèles prédictifs

Voice of Customer AnalyticsCreating intelligence from call center and text data

Préparation de

donnéesText Mining

10©2016 Experian Limited. All rights reserved.

Experian Restricted.

Voice of Customer AnalyticsDe la Voix vers le Texte

Enregistrement d’un appel

Identification des mots Filtrage et analyse des fréquences

Entrée Artificial

Neural Network

Classification de mots

Disponible pour plus de 30 langues

Chaque mot à sa

propre empreinteEt tous les mots

seront uniformisés

11©2016 Experian Limited. All rights reserved.

Experian Restricted.

Enregistrement

des appels

Transformation

en texteDéveloppement

modèles prédictifs

Voice of Customer AnalyticsCreating intelligence from call center and text data

Préparation de

donnéesText Mining

12©2016 Experian Limited. All rights reserved.

Experian Restricted.

Voice of Customer AnalyticsDu Texte vers la données – Natural Language Processing

N-grams

Longueur du texte

Nombre d’adjectives

Customer Score

8552 789

7874 766

4542 568

N-GRAM Groupe de Risque

Envoyer relevé TRES BIEN

Payer demain SUPER

Résolus SUPER

N-GRAM Groupe de Risque

Rappeler TRES MAUVAIS

Contractuel TRES MAUVAIS

Négocier MOYEN

Le niveau de risque

de chaque mot ou phrase est quantifié

niveaux de risque

Un score pour chaque appel

“Oui, je sais que je suis en retard de

paiement. J’ai eu des soucis familiaux,

mais ils sont résolus maintenant.

Pouvez vous m’envoyer un relevé

pour que je puisse payer demain?"

13©2016 Experian Limited. All rights reserved.

Experian Restricted.

Enregistrement

des appels

Transformation

en texteDéveloppement

modèles prédictifs

Voice of Customer AnalyticsCreating intelligence from call center and text data

Préparation de

donnéesText Mining

14©2016 Experian Limited. All rights reserved.

Experian Restricted.

Le problème devient très vite – immense !!!!

Avant : quelques milliers de comptes

avec chacun 100 ou 200 variables à

analyser

Maintenant : 100K appels (pour 1 mois

de données par exemple).

10K appels -> 8K de mots uniques

-> 16K de combinaisons

15©2016 Experian Limited. All rights reserved.

Experian Restricted.

Des techniques avancéspour mieux comprendre les données

Interaction de caractéristiques utilisant des Arbres de Décision

New

Attributes

Gender = M &

Age > 9.5 &

sibsp <= 2.5All data!

Sibsp = Number of Siblings/Spouses Aboard

16©2016 Experian Limited. All rights reserved.

Experian Restricted.

Des techniques avancéspour mieux comprendre les données

Sélection de caractéristique utilisant Forêt Aléatoire

« % decrease in MSE »

« Mean decrease in Gini »

Deux indicateurs pour inventorier les éléments

les plus « prédictifs » de la Forêt Aléatoire

17©2016 Experian Limited. All rights reserved.

Experian Restricted.

Ensemble LearningThe Wisdom of Crowds : Why the Many Are Smarter Than the Few (*)

Méthode 1+ --

+ +

--

+ --

--+

--

+ --

+ +

--

+ --

--+

--

+ --

+ +

--

+ --

--+

--

(*) 2004 : La Sagesse des foules - James Surowiecki

+ --

+ +

--

+ --

--+

--

α +β +γ

Méthode 2

Méthode 3

+ --

+ +

--

+ --

--+

--

+ --

+ +

--

+ --

--+

--

+ --

+ +

--

+ --

--+

--

=

18©2016 Experian Limited. All rights reserved.

Experian Restricted.

Advanced AnalyticsLeverage Machine Learning Algorithms

BIG

DATA-bases

- Il n’y a pas une méthode « champion »

- Il faut tester plusieurs techniques en “labo” pour trouver celle la plus

adaptée à votre problématique (octroi, fraude, recouvrement …)

19©2016 Experian Limited. All rights reserved.

Experian Restricted.

Enregistrement

des appels

Transformation

en texteDéveloppement

modèles prédictifs

Voice of Customer AnalyticsCreating intelligence from call center and text data

Préparation de

donnéesText Mining

Quelques exemples de projets que nous avions menés :

20©2016 Experian Limited. All rights reserved.

Experian Restricted.

Voice of CustomerCas 1 – Contrôle de la Conformité

Problème

Métier

Solution

Avantages

Métier

100% des appels sont vérifiés

Amélioration de performances du centre d’appel

New business insights

Identifier les operateurs non conformes dans le

centre d’appel

Avant : des contrôles aléatoires effectués par un

prestataire sur 6% des appels (~ 100k/mois)

Modèle statistiques pour détecter les operateurs

non conformes

Cette solution analyse 100% des appels

Couverture : 100%

Economie : 47%

Très bonne performance : 85% des

appels non-conformes sont dans les 3

tranches de score les plus basses

Excellent

Très bien

Bien

Mauvais

Très mauvais

21©2016 Experian Limited. All rights reserved.

Experian Restricted.

Score Recouvrement

VOIX

Problème

Métier

Solution

Avantages

Métier

Plus de € encaissés

Réduction du cout de recouvrement

Comparer la performance de recouvrement

des employées

Pas d’analyse des raisons d’impayés et les

raisons de règlement

Score de recouvrement de faible performance

Evaluer la performance du Centre

Natural Language Processing pour grouper

les raisons de paiement vs les raisons de non-

paiement

Développement d’un “Score de recouvrement

VOIX”

Voice of CustomerCas 2 – Améliorer le Recouvrement – raisons d’impayés et analyse de la performance du centre

Appels concluants et

non-concluants

Période de

tempsID Operateur

Evaluation

operateur

Evaluation du

centre d’appel

+

Text Mining

22©2016 Experian Limited. All rights reserved.

Experian Restricted.

Approche classique

Utilisation des données VOIX

Meilleure

Précision

10,7%

1 0 Total

1 10,9% 2,3% 13,2% Sensitivity 0,82

0 10,0% 76,8% 86,8% Specificity 0,89

Population 20,9% 79,1% 100,0% Accuracy 0,88

Actu

al

Clas

s

Predicted Class

1 0 Total

1 12,7% 0,5% 13,2% Sensitivity 0,96

0 3,6% 83,2% 86,8% Specificity 0,96

Population 16,2% 83,8% 100,0% Accuracy 0,96

Predicted Class

Actu

al

Clas

s

Réduction des

pertes

15,0%

Voice of CustomerCas 2 – Résultat : Score de recouvrement VOIX

23©2016 Experian Limited. All rights reserved.

Experian Restricted.

“J’étais dans la rue, à Nanterre, quand j’ai

entendu un bruit dans ma roue. Alors, j’ai

arrêté la voiture sous le pont pour vérifier ma

roue. Et alors, tout d’un coup, deux hommes

avec un pistolet m’ont arrêté et ont pris la

voiture"

Voice of CustomerCas 3 – Text mining et analyses des réseaux sociaux pour identifier des sinistres frauduleux

Problème

Métier

Solution

Avantages

Métier

Réduction de la Fraude

Respect de la politique de conformité

Réduction des coûts

Faible taux de détection de la fraude sur

les sinistres d’assurance

Soupçon d’implication de certains

employées et de certains partenaires

Utilisation de Natural Language Processing

et des analyses sur les réseaux sociaux

afin de détecter des sinistres frauduleux

Différence en

profondeur du réseau

pour accident ou vol

Taille des connections

N-grams

Longueur du texte

Nombre d’adjectives