Upload
ngocong
View
214
Download
0
Embed Size (px)
Citation preview
Utilisation de données et techniques de modélisation innovantes pour l’optimisation de la Fraude et du recouvrement
27 Septembre 2016
Wim Heirman
2©2016 Experian Limited. All rights reserved.
Experian Restricted.
We’re a leading global information services company…
In a faster, more complex world, our data and analytics help people and organisations protect, manage and make the most of their data.
Revenue
US$4.8 bnEBIT
US$1.3 bnMarket Cap*
c. £12bn – UK FTSE Top 50
Employees
c.17,000Offices in
39 countries
Largest markets
US, Brazil, UK
3©2016 Experian Limited. All rights reserved.
Experian Restricted.
We help our clients at every stage of the customer journey with our unique capabilities in…
Analytics
Software
Consulting
4©2016 Experian Limited. All rights reserved.
Experian Restricted.
Plus de 90% des données dans le monde ont été créées ces 2 dernières années….
Eric SchmidtExecutive chairman of Google's new parent company, Alphabet.
“Chaque 2 jours, nous créons autant d’information que dans la période
du début de humanité à 2003”
5©2016 Experian Limited. All rights reserved.
Experian Restricted.
Big Data Analytics Quelques cas d’usage chez Experian
Voice of Customer Analytics
Traduire des conversations téléphoniques en
modèles prédictifs
Transactional Data Insights
KYC (Know Your Customer) au niveau
transactionnel
Social Network Analytics
Identifier les personnes influentes et importantes à
connaitre par vous
6©2016 Experian Limited. All rights reserved.
Experian Restricted.
Voice of Customer Analytics
Traduire des conversations téléphoniques en
modèles prédictifs
Transactional Data Insights
KYC (Know Your Customer) au niveau
transactionnel
Social Network Analytics
Identifier les personnes influentes et importantes à
connaitre pour vous
Big Data Analytics Quelques cas d’usage chez Experian
7©2016 Experian Limited. All rights reserved.
Experian Restricted.
Voice of Customer AnalyticsTraduire des conversations téléphoniques en modèles prédictifs
Les appels téléphoniques des centres de contact ou
de recouvrement contiennent des informations
cruciales sur le comportement de vos clients
…et nous avons la capacité de traduire cette
information en texte puis d’utiliser des techniques
de machine learning pour identifier les mots clés
8©2016 Experian Limited. All rights reserved.
Experian Restricted.
Voice of Customer AnalyticsBusiness applications
Prévoyez le risque
Efficacité et Dynamisme
Intégrez l’axe vocale dans l’analyse
de la performance de l’équipe de
recouvrement
Surveillez et contrôlez la
conformité et la qualité des
appels
Recouvrement
Identification de
prospectsCross selling
Up sellingEvaluation du
centre d’appel
Réduire l’attrition
Détection de
fraude Empêchez/détectez les
fraudes dans les sinistres
d'Assurance
Connaissance
Client
Empêchez/détectez les
fraudes dans le centre
d’appel
9©2016 Experian Limited. All rights reserved.
Experian Restricted.
Enregistrement
des appels
Transformation
en texteDéveloppement
modèles prédictifs
Voice of Customer AnalyticsCreating intelligence from call center and text data
Préparation de
donnéesText Mining
10©2016 Experian Limited. All rights reserved.
Experian Restricted.
Voice of Customer AnalyticsDe la Voix vers le Texte
Enregistrement d’un appel
Identification des mots Filtrage et analyse des fréquences
Entrée Artificial
Neural Network
Classification de mots
Disponible pour plus de 30 langues
Chaque mot à sa
propre empreinteEt tous les mots
seront uniformisés
11©2016 Experian Limited. All rights reserved.
Experian Restricted.
Enregistrement
des appels
Transformation
en texteDéveloppement
modèles prédictifs
Voice of Customer AnalyticsCreating intelligence from call center and text data
Préparation de
donnéesText Mining
12©2016 Experian Limited. All rights reserved.
Experian Restricted.
Voice of Customer AnalyticsDu Texte vers la données – Natural Language Processing
N-grams
Longueur du texte
Nombre d’adjectives
Customer Score
8552 789
7874 766
4542 568
N-GRAM Groupe de Risque
Envoyer relevé TRES BIEN
Payer demain SUPER
Résolus SUPER
N-GRAM Groupe de Risque
Rappeler TRES MAUVAIS
Contractuel TRES MAUVAIS
Négocier MOYEN
Le niveau de risque
de chaque mot ou phrase est quantifié
niveaux de risque
Un score pour chaque appel
“Oui, je sais que je suis en retard de
paiement. J’ai eu des soucis familiaux,
mais ils sont résolus maintenant.
Pouvez vous m’envoyer un relevé
pour que je puisse payer demain?"
13©2016 Experian Limited. All rights reserved.
Experian Restricted.
Enregistrement
des appels
Transformation
en texteDéveloppement
modèles prédictifs
Voice of Customer AnalyticsCreating intelligence from call center and text data
Préparation de
donnéesText Mining
14©2016 Experian Limited. All rights reserved.
Experian Restricted.
Le problème devient très vite – immense !!!!
Avant : quelques milliers de comptes
avec chacun 100 ou 200 variables à
analyser
Maintenant : 100K appels (pour 1 mois
de données par exemple).
10K appels -> 8K de mots uniques
-> 16K de combinaisons
15©2016 Experian Limited. All rights reserved.
Experian Restricted.
Des techniques avancéspour mieux comprendre les données
Interaction de caractéristiques utilisant des Arbres de Décision
New
Attributes
Gender = M &
Age > 9.5 &
sibsp <= 2.5All data!
Sibsp = Number of Siblings/Spouses Aboard
16©2016 Experian Limited. All rights reserved.
Experian Restricted.
Des techniques avancéspour mieux comprendre les données
Sélection de caractéristique utilisant Forêt Aléatoire
« % decrease in MSE »
« Mean decrease in Gini »
Deux indicateurs pour inventorier les éléments
les plus « prédictifs » de la Forêt Aléatoire
17©2016 Experian Limited. All rights reserved.
Experian Restricted.
Ensemble LearningThe Wisdom of Crowds : Why the Many Are Smarter Than the Few (*)
Méthode 1+ --
+ +
--
+ --
--+
--
+ --
+ +
--
+ --
--+
--
+ --
+ +
--
+ --
--+
--
(*) 2004 : La Sagesse des foules - James Surowiecki
+ --
+ +
--
+ --
--+
--
α +β +γ
Méthode 2
Méthode 3
+ --
+ +
--
+ --
--+
--
+ --
+ +
--
+ --
--+
--
+ --
+ +
--
+ --
--+
--
=
18©2016 Experian Limited. All rights reserved.
Experian Restricted.
Advanced AnalyticsLeverage Machine Learning Algorithms
BIG
DATA-bases
- Il n’y a pas une méthode « champion »
- Il faut tester plusieurs techniques en “labo” pour trouver celle la plus
adaptée à votre problématique (octroi, fraude, recouvrement …)
19©2016 Experian Limited. All rights reserved.
Experian Restricted.
Enregistrement
des appels
Transformation
en texteDéveloppement
modèles prédictifs
Voice of Customer AnalyticsCreating intelligence from call center and text data
Préparation de
donnéesText Mining
Quelques exemples de projets que nous avions menés :
20©2016 Experian Limited. All rights reserved.
Experian Restricted.
Voice of CustomerCas 1 – Contrôle de la Conformité
Problème
Métier
Solution
Avantages
Métier
100% des appels sont vérifiés
Amélioration de performances du centre d’appel
New business insights
Identifier les operateurs non conformes dans le
centre d’appel
Avant : des contrôles aléatoires effectués par un
prestataire sur 6% des appels (~ 100k/mois)
Modèle statistiques pour détecter les operateurs
non conformes
Cette solution analyse 100% des appels
Couverture : 100%
Economie : 47%
Très bonne performance : 85% des
appels non-conformes sont dans les 3
tranches de score les plus basses
Excellent
Très bien
Bien
Mauvais
Très mauvais
21©2016 Experian Limited. All rights reserved.
Experian Restricted.
Score Recouvrement
VOIX
Problème
Métier
Solution
Avantages
Métier
Plus de € encaissés
Réduction du cout de recouvrement
Comparer la performance de recouvrement
des employées
Pas d’analyse des raisons d’impayés et les
raisons de règlement
Score de recouvrement de faible performance
Evaluer la performance du Centre
Natural Language Processing pour grouper
les raisons de paiement vs les raisons de non-
paiement
Développement d’un “Score de recouvrement
VOIX”
Voice of CustomerCas 2 – Améliorer le Recouvrement – raisons d’impayés et analyse de la performance du centre
Appels concluants et
non-concluants
Période de
tempsID Operateur
Evaluation
operateur
Evaluation du
centre d’appel
+
Text Mining
22©2016 Experian Limited. All rights reserved.
Experian Restricted.
Approche classique
Utilisation des données VOIX
Meilleure
Précision
10,7%
1 0 Total
1 10,9% 2,3% 13,2% Sensitivity 0,82
0 10,0% 76,8% 86,8% Specificity 0,89
Population 20,9% 79,1% 100,0% Accuracy 0,88
Actu
al
Clas
s
Predicted Class
1 0 Total
1 12,7% 0,5% 13,2% Sensitivity 0,96
0 3,6% 83,2% 86,8% Specificity 0,96
Population 16,2% 83,8% 100,0% Accuracy 0,96
Predicted Class
Actu
al
Clas
s
Réduction des
pertes
15,0%
Voice of CustomerCas 2 – Résultat : Score de recouvrement VOIX
23©2016 Experian Limited. All rights reserved.
Experian Restricted.
“J’étais dans la rue, à Nanterre, quand j’ai
entendu un bruit dans ma roue. Alors, j’ai
arrêté la voiture sous le pont pour vérifier ma
roue. Et alors, tout d’un coup, deux hommes
avec un pistolet m’ont arrêté et ont pris la
voiture"
Voice of CustomerCas 3 – Text mining et analyses des réseaux sociaux pour identifier des sinistres frauduleux
Problème
Métier
Solution
Avantages
Métier
Réduction de la Fraude
Respect de la politique de conformité
Réduction des coûts
Faible taux de détection de la fraude sur
les sinistres d’assurance
Soupçon d’implication de certains
employées et de certains partenaires
Utilisation de Natural Language Processing
et des analyses sur les réseaux sociaux
afin de détecter des sinistres frauduleux
Différence en
profondeur du réseau
pour accident ou vol
Taille des connections
N-grams
Longueur du texte
Nombre d’adjectives