Upload
ontico
View
934
Download
2
Embed Size (px)
Citation preview
Архитектуры Backup & Recovery решенийИлья Космодемьянский[email protected]
Москва 2011
Падения неизбежны
• Не бывает абсолютной отказоустойчивости• “Быстро поднятое не считается упавшим”
“Поднятая” система
• Доступна• Восстановлена производительность• Не потеряны данные
время0падение
восстановление доступности
восстановление производительности
время0падение
восстановление доступности
восстановление производительности
ww
w
ww
w
w
w
w
При работе системы проиходят изменения(копируем файлы, пишем в базу)
время0падение
восстановление доступности
восстановление производительности
ww
w
ww
w
w
w
w
При работе системы проиходят изменения(копируем файлы, пишем в базу) На момент падения:
• Завершились успешно• Не завершились / не известно
Данные:
Процедура восстановления
• Восстановлены данные, которые не изменялись
• Восстановлены данные, которые изменялись в момент падения
• Восстановлена работоспособность системы
Восстановлены данные, которые изменялись в момент падения?
• Обычно это означает, что изменения вычищены из системы
• В транзакционных системах: откатить изменения
Восстановление непротиворечивого состояния системы на момент падения
Восстановление непротиворечивого состояния системы на момент падения
Backup & Recovery
Восстановление непротиворечивого состояния системы на момент падения
Backup & Recovery
Recovery objectives
• RTO
• RPO
• SLA
Что бэкапить?
• Всё?• Системный раздел ОС?
• Данные?• Важные конфиги?
Что бэкапить?
Что бэкапить?
+
Архив
20Tb20Tb
1Tb2Tb
3Tb4Tb
5Tb6Tb
7Tb8Tb
9Tb10Tb
данныеполный backup
Diff -1 дняDiff - 2 дня
Diff - 10 дней
differential backup
Инкрементальный бэкап20Tb
1Tb
1Tb
1Tb
1Tb
1Tb
1Tb
20Tb
полный backup
полный backup
2й день - инкремент
инкремент от полного бэкапа!
Restore set20Tbполный backup
1Tb2й день - инкремент
1Tb3й день - инкремент
Restore set20Tbполный backup
1Tb2й день - инкремент
1Tb3й день - инкремент
Level backup20Tbполный backup - L0
полный backup
2й день - L1
3й день - L2
4й день - L3
20Tb
Backup retentionплн. инк. инк. инк. инк. инк. инк.
1 нед 20Tb 1Tb 1Tb 1Tb 1Tb 1Tb 1Tb
2 нед 20Tb 1Tb 1Tb 1Tb 1Tb 1Tb 1Tb
3 нед 20Tb 1Tb 1Tb 1Tb 1Tb 1Tb 1Tb
4 нед 20Tb 1Tb 1Tb 1Tb 1Tb 1Tb 1Tb
5 нед 20Tb 1Tb 1Tb 1Tb 1Tb 1Tb 1Tb
6 нед 20Tb
120Tb 5Tb 5Tb 5Tb 5Tb 5Tb 5Tb 150Tb
Backup retentionплн. инк. инк. инк. инк. инк. инк.
1 нед 20Tb 1Tb 1Tb 1Tb 1Tb 1Tb 1Tb
2 нед 20Tb 1Tb 1Tb 1Tb 1Tb 1Tb 1Tb
3 нед 20Tb 1Tb 1Tb 1Tb 1Tb 1Tb 1Tb
4 нед 20Tb 1Tb 1Tb 1Tb 1Tb 1Tb 1Tb
5 нед 20Tb 1Tb 1Tb 1Tb 1Tb 1Tb 1Tb
6 нед 20Tb
120Tb 5Tb 5Tb 5Tb 5Tb 5Tb 5Tb 150Tb
Период - 4 недели!
Бэкап файловой системы
• dump/restore
• cpio и tar (GNU!!)
• dd
• rsync
Базы данных
• Заточены под backup&recovery
• Холодный и горячий backup
Архивирование WAL
redoundo
WAL
Archivelog
Как выглядит бэкап?
• Копируем датафайл
• Он (возможно) неконсистентен• Для восстановления нужны архивные логи
Oracle
• RMAN
• Уровни• параллелизм• работа с железом• каталог
PostgreSQL
• Полный бэкап• Архивирование WAL
• Нет уровней (вернее есть но один)
MySQL
• Enterprise Backup и Percona XtraBackup
• Только для транзакционных энджинов
Вредные советы
• Падения бывают не только от сбоя железа, но и от кривых рук• Проблемы от кривых рук очень быстро расползаются с мастера
• За самой репликацией нужен глаз да глаз
Заменяйте бэкап репликацией!
Вредные советы
• Пока не понадобилось восстановление, про бэкап никто не помнит
• Часто это обязанность самого младшего админа
Выделяйте человеческие ресурсы на обеспечение бэкапа по остаточному принципу!
Вредные советы
• Любой бэкап может быть битым• Проверить можно только восстановлением
Тестовое восстановление придумали трусы!
Вредные советы
• C backup & recovery мелочей не бывает
• “В системе было предусмотрено решение HP DataProtector стоимостью $$$$$$, но никто не вспомнил настройки LVM”
• Сервер с каталогом RMAN восстановить не удалось
Главное чтобы в целом все как-то работало!
• W. Curtis Preston - Backup & Recovery: Inexpensive Backup Solutions for Open Systems
• Steven Nelson - Pro Data Backup and Recovery
• Oracle Backup and Recovery User's Guide