Upload
1-
View
149
Download
0
Embed Size (px)
Citation preview
Евгений ПотаповITSumma.ru, генеральный директор
Круглоcуточное удаленное администрирование серверов и техническая поддержка сайтов
150 клиентов на поддержке
Более 1000 серверов на поддержке
100 миллионов уникальных посетителей
• Для магазина с оборотом в 300 миллионов рублей в год один час даунтайма стоит 34 тысячи рублей
• Регулярная недоступность сайта и долгое время ответа приводят к снижению позиции сайта в поисковых системах
• Снижается лояльность постоянных пользователей
• Снижается рейтинг сайта в рекламных системах
Цена простоя
• Медицинская инфраструктура: надежность хостинга, архитектура, резервирование
• Опыт персонала: культура разработки, навыки поддержки, навыки администрирования
• Образ жизни: количество и скорость изменений на проекте, взаимодействие с внешним миром
Отказоустойчивость
• Реселлер или собственный хостинг?реселлер - плохо
• Аренда дата-центра или собственный дата-центр?аренда – не очень хорошо
• Виртуальные или «железные» серверывиртуализация – не всегда хорошо
• Географическое распределение дата-центроввозможность взять резервный сервер в другом дата-центре - хорошо
Хостинг
• Защита от DDOS? Поведение в случае крупного DDOS?«вытаскивают шнур» – надо позаботится о защите
• Доступность KVM, время замены оборудования в случае аварии, время установки нового сервера
• Часы работы и время реакции поддержки хостинга
Хостинг
• Есть ли резервная площадка? Как поддерживается ее актуальность? Online-синхронизация файлов, базы данных
• Когда последний раз проверялся «резерв» в бою?
• Насколько связан резервный дата-центр с основным дата-центром?
• Каким образом будет осуществляться переключение на резервную площадку в случае аварии?
Резервирование
• Резерв – это не бэкап, как часто ведется резервное копирование?
• Куда сохраняются резервные копии, изолирована ли площадка с резервными копиями от основной площадки?
• Как быстро можно восстановиться из резервной копии? Какое максимальное количество данных может быть потеряно в случае утраты данных на основной площадке?
• Когда последний раз проверяли бэкап?
Бэкап
• Упавший сайт не всегда означает упавший сервер, ведется ли мониторинг доступности бизнес-функций?
• Насколько изолирован мониторинг от основной площадки?
• Кто и каким образом узнает о падении сайта/сервера, как быстро?
• Мониторинг должен сообщать о приближении аварии, а не о том, что она произошла.
Мониторинг
• Используется ли система контроля версий? Есть ли версия проекта для разработки и тестирования? Как быстро можно «откатиться» в случае аварии?
• Какой опыт у разработчиков? Прежде всего – опыт эксплуатации запущенного проекта.
• Соблюдается ли культура разработки?
• Ведется ли документация?
• Насколько доступны разработчики?
Разработка
• Кто занимается системным администрированием проекта? Насколько доступны эти люди?
• Есть ли опыт эксплуатации сложных проектов?
• Есть ли опыт разработки? Опыт взаимодействия с разработчиками?
Администраторы
• Большинство аварий происходят из-за человеческого фактора.
• Как часто происходят изменения? Можно ли «откатить» систему на предыдущую версию в случае аварии?
• Если «падать» совсем нельзя – сохраняется ли резервная копия с предыдущей версией?
• В идеальном мире любые изменения делаются «инкрементально».
Изменения на сайте
• Проводится ли нагрузочное тестирование? Есть ли понимание перспектив роста?
• Первые крупные рассылки практически наверняка пройдут с авариями.
• Есть ли возможность остановить маркетинговую кампанию? Если нет – надо максимально подготовиться.
Маркетинговые кампании
Евгений Потаповhttp://facebook.com/eapotapov
http://itsumma.ru