1
Le big-data et la réclame en ligne Nicolas Grislain [email protected] Vincent Lepage [email protected] Le RTB data-révolutionne la pub en ligne Évolution des techniques publicité individualisée en publicité individualisée en temps réel : temps réel : Real-Time Bidding RTB = enchères au second prix second prix en ~ 100ms 100ms mais rencontre entre offre et demande très asymétrique asymétrique AlephD aide les éditeurs à tirer le meilleur du RTB Peu important dans une enchère concurrentielle, le prix de réserve (floor) est crucial en RTB Le gagnant est prêt à payer et il paye Le gagnant est prêt à payer mais paye peu Technologie 2 modes d'analyse statistique traitement temps-réel temps-réel pour réagir aux dernières informations : traitement simple, stockage en mémoire traitement de fond fond sur ensemble des données bons prédicteurs : traitement différé, stockage distribué De nombreux défis statistiques calcul distribué : paradigme map-reduce données cachées : floor informatif vs floor optimal Des résultats prometteurs stratégie triviale, floor statique : +4% stratégie temps-réel : +30% arbre de décision (modèles logistiques, régularisation, en test) distribution de gains la plus vraisemblable Passage à l'échelle Aujourd'hui : ~100 Mimpressions/mois ~100 impressions/sec 100 Go/mois, ~5 min d'estimation Voir la présentation HTML5 sur www.alephd.com/datatuesday2012

Data Tuesday 20 nov 2012 Cinequant - Alephd

Embed Size (px)

Citation preview

Le big-data et la réclame en ligne

Nicolas Grislain [email protected]

Vincent Lepage [email protected]

Le RTB data-révolutionne lapub en ligneÉvolution des techniques ⇒ publicité individualisée enpublicité individualisée en

temps réel :temps réel : Real-Time Bidding

RTB = enchères au second prixsecond prix en ~100ms100ms

mais rencontre entre offre et demande très asymétriqueasymétrique

AlephD aide les éditeurs àtirer le meilleur du RTBPeu important dans une enchère concurrentielle, le prix de

réserve (floor) est crucial en RTB

Le gagnant estprêt à payer et ilpaye

Le gagnant estprêt à payer mais

paye peu

Technologie2 modes d'analyse statistique

traitement temps-réeltemps-réel pour réagir aux dernières

informations : traitement simple, stockage en mémoire

traitement de fondfond sur ensemble des données ⇒ bons

prédicteurs : traitement différé, stockage distribué

De nombreux défisstatistiques

calcul distribué : paradigme map-reduce

données cachées : floor informatif vs floor optimal

Des résultats prometteurs

stratégie triviale, floor statique : +4%

stratégie temps-réel : +30%arbre de décision (modèles logistiques, régularisation, en

test)

distribution de gains la plus vraisemblable

Passage à l'échelleAujourd'hui :

~100 Mimpressions/mois ~100 impressions/sec

⇒ 100 Go/mois, ~5 min d'estimation

Voir la présentation HTML5 surwww.alephd.com/datatuesday2012