Zabbix и миллионы метрик: наилучший опыт масштабного...

Preview:

Citation preview

Zabbix и миллионыметрик Алексей Владышев

Обо мне

Алексей Владышев

Автор Zabbix

CEO и Архитектор

Twitter: @avladishev

Мониторинг Начало

История

Сбор данных

Zabbix server

История

Анализ

Сбор данных

Zabbix server

История

Анализ

Сбор данных

Оповещения

Zabbix server

Zabbix агент?

Zabbix агент?Минусы

- Установка

Плюсы+ Доступ к любым метрикам доступным OS

+ Гибкость на уровне коммуникаций (пассивные и активные проверки)

+ Очень маленький и быстрый, нет влияния на саму систему

+ Легко расширить функциональность модулями и скриптами

…много ещё…

Zabbix агент?Минусы

- Установка

Плюсы+ Доступ к любым метрикам OS

+ Гибкость на уровне коммуникаций (пассивные и активные проверки)

+ Очень маленький и быстрый, нет влияния на саму систему

+ Легко расширить функциональность модулями и скриптами

…много ещё…

95% используют Zabbix агента

Метрики

CPU load

Free disk space

WEB server state

Анализ в режиме реального времени

Анализ в режиме реального времени

Метрики

CPU load

Free disk space

WEB server state

Триггеры

CPU load > 5

Free disk space < 10%

WEB server state = 0 (down)

100 хостов

500 хостов

1000 хостов

Как управлять конфигурацией?

Шаблон - это набор параметров для мониторинга

Шаблон - это набор параметров для мониторинга

Linux сервер? Используем Template Linux

Процессор, диски, сеть, память

MySQL? Используем Template MySQL

Доступность, TPS, статус репликации

Шаблон - это набор параметров для мониторинга

Linux сервер? Используем Template Linux

Процессор, диски, сеть, память

MySQL? Используем Template MySQL

Доступность, TPS, статус репликации

Linux серверы

Сервер 1

Сервер 2

Сервер 3

Одинаковые, но разные

Одинаковые, но разные

Linux серверы

/ /data /tmp

/ /tmp

/ /home /data /tmp

Сервер 1

Сервер 2

Сервер 3

Одинаковые, но разные

Linux серверы

/ /data /tmp

/ /tmp

/ /home /data /tmp

Template Linux 1

Template Linux 2

Template Linux 3

Сервер 1

Сервер 2

Сервер 3

Низкоуровневое обнаружение

Один шаблон

Template Linuх

с одним правилом

обнаружения

Сервер 1

Сервер 2

Сервер 3

Низкоуровневое обнаружение

Один шаблон

Template Linuх

с одним правилом

обнаружения

Сервер 1

Сервер 2

Сервер 3

//data/tmp

//tmp

//home/data/tmp

Один шаблон мониторинга для разных устройств!

Сервер

Сервер

Сервер

Сервер

Сервер

Сервер

Сервер

Сервер

Сервер

Сервер

Сервер

Сервер

Сервер

Сервер

Сервер

Сервер

Масштабирование

11 terabits на выходе 80 точек присутствия

25.000 хостов

6.000.000 метрик 3.000.000 триггеров 90 прокси

Производительность Zabbix

7.510 проверок в секунду (NVPS)

25.000 хостов

Результат проверки = 50 байт

Limelight: 26ГБ в день

2TB история, максимум 6 месяцев

Размер базы данных

Что выбрать?

Что выбрать?

VS

Более 1.000.000 метрик и объём данных от 1TB

Более 1.000.000 метрик и объём данных от 1TB

1 место:

2 место:

3 место: Oracle & DB2 5 %

Более 1.000.000 метрик и объём данных от 1TB

1 место: MySQL 80 %

2 место: PostgreSQL 15 %

3 место: Oracle & DB2 5 %

Управление

Zabbix server

Управление

Zabbix server

Сентябрь

Октябрь

Ноябрь

Zabbix server

Партиционирование

А если хостов ещё больше?

60.000 хостов

60.000 хостов2.000.000 метрик 20.000.000 триггеров 6TB история 40 прокси

Производительность Zabbix

21.000 проверок в секунду (NVPS)

Автоматизация

Сетевое обнаружение

Сеть

Обнаружен DNS

Обнаружен Zabbix Agent

ZabbixОбнаружен HTTP сервер

Авторегистрация

Я - новый сервер Metadata: Linux/MySQL

Zabbix

Сеть

Агент

Управление агентами

Управление конфигурацией

Привязка к шаблонам, добавление хостов

Распределённый мониторинг

200.000 хостов

200.000 хостов5.000.000 метрик 2.000.000 триггеров Минимум 5ТB история 11.000 прокси

Производительность Zabbix

20.000 проверок в секунду (NVPS)

Новый магазин!

Реестр

Прокси

Новый магазин!

Реестр

ZabbixПрокси

Новый магазин!

Zabbix API

Реестр

Так, а теперь переходим на Zabbix 3.0!

Проще, чем кажется

Обратная совместимость с агентами

Но не с прокси!

Автоматическое обновление структуры базы

Таблицы с историей не трогаем

Не ломаем API

Hosts Metrics Triggers Proxy DB

25К 6М 3М 45

60К 2М 20М 40

200К 5М 2М 11К

Итог

ИтогНе надо бояться

200.000 хостов

6.000.000 метрик, 20.000.000 триггеров

Терабайты истории

11.000 прокси

Автоматизация и HA

Не забываем о выборе правильного железа для Zabbix

ИтогНе надо бояться

200.000 хостов

6.000.000 метрик, 20.000.000 триггеров

Терабайты истории

11.000 прокси

Автоматизация и HA

Не забываем о выборе правильного железа для Zabbix

Спасибо!Приходите на стенд!

Лотерея дважды в день!

Twitter: @avladishev

Email: alex@zabbix.com

Recommended