18
Anti-fraud solutions in RTB Vadim Antonyuk IPONWEB

Anti-fraud solutions in RTB / Вадим Антонюк (IPONWEB)

  • Upload
    ontico

  • View
    191

  • Download
    1

Embed Size (px)

Citation preview

Page 1: Anti-fraud solutions in RTB / Вадим Антонюк (IPONWEB)

Anti-fraud solutions in RTB

Vadim Antonyuk

IPONWEB

Page 2: Anti-fraud solutions in RTB / Вадим Антонюк (IPONWEB)

Anti-fraud solutions in RTB

I. ВступлениеI. Вступление

II. Алгоритмический подходII. Алгоритмический подход

III. Техническая реализация расчетаIII. Техническая реализация расчета

IV. ЗаключениеIV. Заключение

Page 3: Anti-fraud solutions in RTB / Вадим Антонюк (IPONWEB)

I. ВступлениеI. Вступление виды фрода в RTB;виды фрода в RTB; экономический эффект фрода;экономический эффект фрода; борьба с фродом: short term vs long term effectsборьба с фродом: short term vs long term effects

II. Алгоритмический подходII. Алгоритмический подход

III. Техническая реализацияIII. Техническая реализация

IV. ЗаключениеIV. Заключение

Anti-fraud solutions in RTB

Page 4: Anti-fraud solutions in RTB / Вадим Антонюк (IPONWEB)

Anti-fraud solutions in RTB

Зачем боремся? Рекламодатели платят за viewability и конверсии(к этому мы еще вернемся)

С чем боремся?

(1) Боты - программы, в автоматическом режиме выполняющие действия, похожие на действия человека (просмотры, клики, конверсии);

(2) Ad Stacking - несколько баннероводин поверх другого;

(3) Сайты-"пустышки" – создаваемыеспециально для показа рекламы;

(4) Domain URL spoofing (via IFrames);

Page 5: Anti-fraud solutions in RTB / Вадим Антонюк (IPONWEB)

Anti-fraud solutions in RTB

Где граница между “добром” и “злом”? Incentivised traffic? Display to video arbitrage?

Page 6: Anti-fraud solutions in RTB / Вадим Антонюк (IPONWEB)

Anti-fraud solutions in RTB

Экономический эффект от фрода

Бюджет городского строительства Москвы

Оценка Эффект per annum

Консервативная (WhiteOps) $7.2 млрд. (@ 15% fraud rate)

Умеренно-агрессивная $10-50 млрд.

Маргинальная “сверху”(2/3 * US GDP * 10% * 20%)

$200 млрд.

Официальные данные $30 млрд (за 2016-19 гг.)

Page 7: Anti-fraud solutions in RTB / Вадим Антонюк (IPONWEB)

Anti-fraud solutions in RTB

Зачем боремся конкретно мы (вы)?..оборот трафика в экосистеме – это же хорошо?

- да, но..

Page 8: Anti-fraud solutions in RTB / Вадим Антонюк (IPONWEB)

I. ВступлениеI. Вступление

II. Алгоритмический подходII. Алгоритмический подход эксперт или алгоритм?эксперт или алгоритм? there is no single magic pill feature;there is no single magic pill feature; cascade waterfall;cascade waterfall; feature selection for machine learning clusteringfeature selection for machine learning clustering

III. Техническая реализация расчетаIII. Техническая реализация расчета

IV. ЗаключениеIV. Заключение

Anti-fraud solutions in RTB

Page 9: Anti-fraud solutions in RTB / Вадим Антонюк (IPONWEB)

Anti-fraud solutions in RTB

Эксперт:

Может принимать

решение “case by case”

на основе различных

комбинаций внутренних

и внешних источников

данных;

“Оut of the box” thinking

Алгоритм:

Масштабируем

(*) cайт: cnn.com dr-license.com

время на сайте: 3:40 12:45

страниц за посещение: 2.24 36

bounce rate: 58% 7%

good site obvious fraud?

(*) больше примеров в игре “Бот или Человек” на стенде IOW

Page 10: Anti-fraud solutions in RTB / Вадим Антонюк (IPONWEB)

Anti-fraud solutions in RTBКаскадная фильтрация бид-реквестов в IOW

I. Экспертные фильтры:(domains, publishers)

II. Автоматические фильтрына основе простых правил:

(datacenters IPs,domains traffic spikes,

low cookie age publishers)

III. Вероятностная оценка, кластеризацияметодами машинного обучения

(p_good > threshold)

Page 11: Anti-fraud solutions in RTB / Вадим Антонюк (IPONWEB)

Anti-fraud solutions in RTB

Автоматическая фильтрация на основе “простых” правил1) block a bid request if user_IP identified to belong to a datacenter;

2) block sites with swinging traffic patterns:

3) block spikes of traffic from particular IP;

4) block high frequency UUIDs traffic;

5) block publishers with significant share of traffic where bid user_ip != imp user_ip;

Page 12: Anti-fraud solutions in RTB / Вадим Антонюк (IPONWEB)

Anti-fraud solutions in RTB

Кластеризация бид-реквестов методами машинного обучения (1) [Expectation maximization and other math stays in brackets] Feature selection:

(1) user_ip- PII (personally identifiable information) issues;- 4 bytes or 3 bytes IPs?- what to do with proxies?

(2) user agent- old browsers contains known security breaches;- easy to forge, but still adds value;

(3) site- “clever” bots visit good sites;- good in combination with publisher data

Page 13: Anti-fraud solutions in RTB / Вадим Антонюк (IPONWEB)

Anti-fraud solutions in RTB

Кластеризация бид-реквестов методами машинного обучения (2)Построение “карты” | Применение “карты”

Page 14: Anti-fraud solutions in RTB / Вадим Антонюк (IPONWEB)

I. ВступлениеI. Вступление

II. Алгоритмический подходII. Алгоритмический подход

III. Техническая реализация расчетаIII. Техническая реализация расчета Learning sample;Learning sample; The framework choice;The framework choice; Room for optimization?Room for optimization?

IV. ЗаключениеIV. Заключение

Anti-fraud solutions in RTB

Page 15: Anti-fraud solutions in RTB / Вадим Антонюк (IPONWEB)

Anti-fraud solutions in RTB

А теперь мы попробуем со всем этим взлететь:

Learning sample: 230 Bn bids requests (~40Tb of data); Hadoop framework; GCE, 140 машинах класса n1-highmem-8;

=> 22 расчетных часа

Room for optimization?- Hadoop vs Spark?

- Python vs Scala?

Page 16: Anti-fraud solutions in RTB / Вадим Антонюк (IPONWEB)

I. ВступлениеI. Вступление

II. Алгоритмический подходII. Алгоритмический подход

III. Техническая реализация расчетаIII. Техническая реализация расчета

IV. ЗаключениеIV. Заключение

Anti-fraud solutions in RTB

Page 17: Anti-fraud solutions in RTB / Вадим Антонюк (IPONWEB)

Anti-fraud solutions in RTB

Summing it up

(1) Economically, it does make sense to fight fraud if your business horizon is over half year;

(2) Each individual metric can be gamed relatively easy. Use various metrics and multi-level blocking logic;

(3) Update your filters on a biweekly / monthly scale;

(4) Calibrate your results against the industry.

Page 18: Anti-fraud solutions in RTB / Вадим Антонюк (IPONWEB)

Anti-fraud solutions in RTB

Questions?