"Кластеры баз данных: делаем сложные вещи просто"...

Кластеры баз данных:делаем сложные вещи просто

Андрей Тихоновatikhonov@avito.ru

Avito.ru DevOps

Содержание

● Как начинается Highload?● Балансируем нагрузку на Backend● Методы масштабирования БД● Создаём кластер Redis/Memcached/Tarantool● Создаём кластер PostgreSQL

Немножко статистики Avito

● 1M+ запросов в минуту к Backend● 1Gb/s+ исходящий трафик (не считая картинки)● 100K+ запросов в секунду на nginx-балансеры● Терабайты или миллиарды картинок

Как начинается Highload?

Web-server Backend Database

Web-server Backend * Database

CacheStorage Queue

Web-server * Backend * Database *

Cache *Storage * Queue *

Как работает Avito:

Балансируем нагрузку на Backend

nginx.conf:... location / { proxy_pass http://backend.local; }...

nginx.conf:...upstream backend { server backend01.local:80; server backend02.local:80; server backend03.local:80;}... location / { proxy_pass http://backend; }...

Методы масштабирования БД

Backend

Database

Backend

MasterSlave

Replication

*репликация Master-Master здесь не рассматривается

Репликация Master-Slave

Backend

Shard02Shard01

Шардирование

Создаём кластер Redis/Memcached/Tarantool

Проблемы

● Установление подключения – долгая операция● Малый срок жизни подключения● Больше подключений – больше накладных

расходов на сервере

Решаем проблемы с помощью Twemproxy*

● Прозрачно проксирует на уровне протокола Memcached/Redis/Tarantool**

● Держит постоянное подключение к серверу● Устанавливает мало подключений к серверу

* см. также mcrouter, redis-proxy, redis-resharding-proxy, etc

** нужен патч

twemproxy-redis-single.yml:

alpha: listen: 127.0.0.1:22121 redis: true servers: - 127.0.0.1:6379:1

Шардируем с помощью Twemproxy

● Автоматическое шардирование● Поддерживает стойкое хэширование● Автоматически группирует и конвейеризует

запросы и ответы

twemproxy-redis-shard.yml:

beta: listen: 127.0.0.1:22122 redis: true distribution: ketama hash: murmur servers: - 127.0.0.1:6381:1 server1 - 127.0.0.1:6382:1 server2

Добавляем отказоустойчивость Redis-кластера

● Master-Slave Replication средствами Redis

Master-Slave Replication средствами Redis

redis.conf (slave side):

slaveof 192.168.10.1

● Master-Slave Replication средствами Redis

● Master-Slave Replication средствами Redis● Автоматическое переключение в случае отказа

мастера с помощью Redis Sentinel

Redis Sentinel

● Мониторит состояние всех нод кластера● Уведомляет об ошибках● Автоматически промотирует slave до master в случае

падения master● Выступает в качестве провайдера конфигурации

Redis Sentinel

redis-sentinel.conf:

sentinel monitor cluster01 192.168.10.1 6379 2sentinel down-after-milliseconds cluster01 60000sentinel failover-timeout cluster01 180000sentinel parallel-syncs cluster01 1

мастера с помощью Redis Sentinel

мастера с помощью Redis Sentinel● Прозрачное для клиента переключение с помощью

HAProxy

● TCP-прокси● Балансирует нагрузку разными алгоритмами

– Round-robin, least connections, first available, param* hash● Primary/backup группы backend-серверов● Различные способы проверки доступности серверов

– TCP connect, protocol* check, TCP send-expect

HAProxy

haproxy-redis.conf:

listen redis-cluster bind *:16379 option tcp-check balance roundrobin

tcp-check send PING\r\n tcp-check expect string +PONG tcp-check send info\ replication\r\n tcp-check expect string role:master tcp-check send QUIT\r\n tcp-check expect string +OK

server redis01 192.168.10.1:6379 check port 6379 check inter 2s server redis02 192.168.10.2:6379 check port 6379 check inter 2s

мастера с помощью Redis Sentinel● Прозрачное для клиента переключение с помощью

HAProxy

Создаём кластер PostgreSQL

Проблемы

● Одно подключение – один процесс, создание процесса – дорогостоящая операция

● План запросов и т. п. кэшируется внутри процесса, новое подключение – пустой кэш

● Малый срок жизни подключения● Больше подключений – больше накладных

расходов на сервере

Решаем проблемы с помощью PgBouncer*

● Прозрачно проксирует на уровне протокола PgSQL

● Держит постоянное подключение к серверу● Выполняет запросы до и после подключения● Мультиплексирует клиентские подключения в

трёх режимах: session, transaction, statement pooling

* см. также PgPool

Решаем проблемы с помощью PgBouncer

pgbouncer.ini:

[databases]

main = host=db-main pool_size=5 connect_query='select prepare_statements_and_stuff()'

[pgbouncer]

pool_mode = transactionmax_client_conn = 1024

Синхронная и асинхронная репликация

Синхронная:● Надёжная● Медленная

Асинхронная:● Быстрая● Теряет ACID, так как слейвы отстают

Физическая и логическая репликация

Физическая:● Полная копия всех данных● Загружает I/O

Логическая:● Можно выбирать, какие данные копировать● Загружает CPU

Создаём MSR-кластер

1 master, 1 slave:● Распределяем нагрузку на чтение● Нет отказоустойчивости

1 master, 2+ slave:● Можем выдержать падение мастера

Создаём отдельную реплику для индексации

● Логическая репликация:

– Не вымывается кеш на мастере– Копируются только нужные данные

● Данные умещаются в RAM – нет медленного I/O

Шардируем с помощью PL/Proxy*

● Языковое расширение PostgreSQL● Устанавливается на одной прокси-ноде● Вся логика шардирования описывается в

хранимых процедурах PostgreSQL● Можно реализовать поддержку шард с MSR

* см. также Citus

Подведём итоги

● Много кратковременных подключений к серверу – плохо, используем прокси

● Нужна отказоустойчивость – используем Master-Slave Replication, делаем несколько слейвов

● Слейвы должны быть не слабее мастера● Данные не умещаются на одном сервере – шардируем на

несколько серверов● Все эти подходы можно комбинировать

"Кластеры баз данных: делаем сложные вещи просто"...

Internet

ИННОВАЦИОННЫЕ КЛАСТЕРЫ В ГЛОБАЛЬНОЙ … · ББК 65.26 И 665 И 665 ИННОВАЦИОННЫЕ КЛАСТЕРЫ В ГЛОБАЛЬНОЙ ЭКОНОМИКЕ:

Технология ASR 9000 nV — кластеры и сателлиты

Kubernetes в Avito - Евгений Ольков

статья1 кластеры в европе

Технологические платформы и инновационные кластеры

Avito Duplicate Ads Detection @ kaggle

Avito Auto

Golang в avito

Пилотные кластеры и рейтинг инновационного развития регионов

Кластеры и Технопарки: общие элементы

Présentation avito

Avito iab1502 olga ky

Территориальные инновационные кластеры регионов России

Avito Контекст

Кластеры баз данных делаем сложные вещи просто / Андрей Тихонов (Avito)

"Бэк-офис в Avito: миллиард объявлений на 10 серверах" Вячеслав Крюков (Avito)

Екатерина Мельникова – БСС Инжиниринг Алексей Тихонов – ДИТ г. Москвы

"RT индексы в поиске Avito" Вячеслав Крюков (Avito)

pgconf.ru 2015 avito postgresql

Архитектура поиска в Avito / Андрей Смирнов (Avito)