Présentation Alter Way GROUP - RMLL2011.rmll.info/IMG/pdf/Reprise_sur_incident_-_RMLL_2011.pdf ·...

Preview:

Citation preview

RMLL 2011

Reprise sur incident

Qui suis-je ?

» Jean-Marc Fontaine

» Consultant pour Alter Way Consulting

» Président de l'AFUP

» Formateur / Professeur vacataire à l'université de Saint Quentin

» Co-auteur du livre blanc « Industrialisation PHP »

» Auteur du blog Industrialisation-PHP.com

Cela va arriver !Cela va arriver !

12/07/11

Le but de cette conférenceLe but de cette conférence

12/07/11 ALTER WAY - Reprise sur incident

Diminuer la gravité

» Durée d'indisponibilité

» Perte de données

» Rupture de la confidentialité

12/07/11 ALTER WAY - Reprise sur incident

Minimiser l'impact

» En terme d'image

» Financier

12/07/11

Se préparerSe préparer

12/07/11 ALTER WAY - Reprise sur incident

Avoir un plan

» Se préparer pour être efficace le jour J

» Equipe spécialisée

» Implication des fournisseurs

12/07/11 ALTER WAY - Reprise sur incident

Mesures de mitigation

» Machines virtuelles configurées

» Réplication de la base de données

» Désactivation de certaines fonctionnalités

» Version statique

12/07/11 ALTER WAY - Reprise sur incident

Sauvegardes

» Sauvegarder tout

» Sauvegarder régulièrement

» Garder un historique intelligent

12/07/11 ALTER WAY - Reprise sur incident

Journalisation (1/2)

» Système

» Application

» Déploiements

» Opérations de maintenance

12/07/11 ALTER WAY - Reprise sur incident

Journalisation (2/2)

» Privilégier les formats plats Manipulation aisée Signature Compressibles Gestion des droits aisées Rotation

12/07/11 ALTER WAY - Reprise sur incident

Communiquer en interne

» Certains pics de fréquentations sont anticipables :– Période de l'année– Publicité– Promotion– Communication dans les médias

12/07/11 ALTER WAY - Reprise sur incident

Déploiement automatisé

» Rapide

» Pas sujet à la pression

» Outils :– Ant– Capistrano– Phing

12/07/11 ALTER WAY - Reprise sur incident

Tester les procédures

» Régulièrement

» Avec précaution

12/07/11

DétecterDétecter

12/07/11 ALTER WAY - Reprise sur incident

Supervision

» Ressources Nagios Centreon Zabbix

» Journaux

» Application

» Disponibilité Pingdom NetVigie

12/07/11 ALTER WAY - Reprise sur incident

Facilitez le contact

» Personne / service à contacter identifiés

» Moyens de contact disponibles facilement

» Réactivité aux contacts entrants

12/07/11

CommuniquerCommuniquer

12/07/11 ALTER WAY - Reprise sur incident

Communication

» Isoler l'équipe d'intervention

» Escalader en interne si nécessaire

» Communication externe :– Régulière– Aussi transparente que possible– Page d'état

12/07/11

AnalyserAnalyser

12/07/11 ALTER WAY - Reprise sur incident

Identification de la cause

» Interne– Panne matérielle– Instabilité logicielle– Bogue applicatif– Erreur humaine

» Externe– Attaque– Panne matérielle– Pic de fréquentation

12/07/11 ALTER WAY - Reprise sur incident

Portée

» Quels sont les éléments touchés ?

» Le service est-il réduit ou coupé ?

12/07/11 ALTER WAY - Reprise sur incident

Impact

» Problème de sécurité ?

» Perte de données ?

» Atteinte à l'image ?

12/07/11

CorrigerCorriger

12/07/11 ALTER WAY - Reprise sur incident

Correction

» Activer les mesures de mitigation si nécessaire

» Appliquer les mesures correctives

» Déployer l'application si nécessaire

» En dernier recours tout couper

12/07/11

ApprendreApprendre

12/07/11 ALTER WAY - Reprise sur incident

Capitaliser

» Méthode des 5 pourquoi

» Intégrer le résultat aux procédures de test

12/07/11 ALTER WAY - Reprise sur incident

Récapitulatif

» Se préparer

» Communiquer

» Analyser

» Corriger

» Apprendre

12/07/11 ALTER WAY - Reprise sur incident

Merci !

» Email : jm@jmfontaine.net

» Twitter : jmfontaine

» Blog : www.jmfontaine.net

» Autre blog : www.industrialisation-php.net

12/07/11 ALTER WAY - Reprise sur incident

Crédits

Recommended