42
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Incidens-, probléma-, változáskezelés Szombath István [email protected] Intelligens rendszerfelügyelet

Incidens-, probléma-, változáskezelés

Embed Size (px)

DESCRIPTION

Intelligens rendszerfelügyelet. Incidens-, probléma-, változáskezelés. Szombath István szombath @ mit.bme.hu. Tartalomjegyzék. Probléma / motiváció Eseménykezelés ( ism .) Incidenskezelés Problémakezelés Konfigurációmenedzsment ( ism ) Hatásanalízis / diagnosztika Változáskezelés Demo. - PowerPoint PPT Presentation

Citation preview

Page 1: Incidens-, probléma-, változáskezelés

Budapesti Műszaki és Gazdaságtudományi EgyetemMéréstechnika és Információs Rendszerek Tanszék

Incidens-, probléma-, változáskezelés

Szombath Istvá[email protected]

Intelligens rendszerfelügyelet

Page 2: Incidens-, probléma-, változáskezelés

Tartalomjegyzék Probléma / motiváció Eseménykezelés (ism.) Incidenskezelés Problémakezelés Konfigurációmenedzsment (ism) Hatásanalízis / diagnosztika Változáskezelés

Demo

Page 3: Incidens-, probléma-, változáskezelés

Bevezető

?!#@?

Hiba esetén értesítendő o Józsi a rendszergazdao IT supporto Help Desk

o Telefonono E-mailbeno Keretrendszer

segítségével

Nem megy a vindóz, nem

tudok dolgozni!Értem uram,

mik a tünetek?Most mondtam,

nem megy!

Kapcsolja ki a gépet, majd be.

Ma már az n. ügyfél fordul hozzám fura

panaszokkal. Továbbítom a problémát a

nagykutyáknak.Oh, újra

működik, csodás!

A múlt heti frissítésben

valószínű maradt egy bug. Ezt

azonnal orvosolni kell!

Page 4: Incidens-, probléma-, változáskezelés
Page 5: Incidens-, probléma-, változáskezelés

Gartner felmérés Milyen szintű integráció van az eseménykezelés

(mgmt) és a Service Desk között?o 10% semmilyeno 46% „analóg” manuális (telefon, …)o 20% félig automatizált („digitális manuális”)o 24% teljesen automatizált

Ki felelős a kritikus problémákért?o…o 17% nem formalizált

Page 6: Incidens-, probléma-, változáskezelés

ITIL IT menedzsment

folyamatokhozo keretrendszero technikáko eszközöko „best practices”

Jobbat Olcsóbban

Page 7: Incidens-, probléma-, változáskezelés

Terminológia Monitorozás != eseménykezelés

oMiért is? Ticket

o Trouble Ticket, RFC Ticket, …o Azonosítóo Visszahívási cím (Callback Number)o Jól strukturált információ

RFCo Request for Changeo Ticket ha változtatni szeretnénk valamin

Page 8: Incidens-, probléma-, változáskezelés

Terminológia Baseline – alapbeállítás Known Error (Ticket)

o Ismert hiba (GyIK, FAQ, RTFM, …)oMiért is lesz ez hasznos?

Reaktivitás, proaktivitás Példa az eseményekre:

o Új bejegyzés egy naplófájlbano Script üzenetet küld (e-mail, …)o Ágens jelentést küldo…

Page 9: Incidens-, probléma-, változáskezelés

Menedzsment folyamatok

Event Management

IncidentManagement

ProblemManagement

Service DeskFunction

CapacityManagement

AvailabilityManagement

Service LevelManagement

IT ServiceContinuity

Management

IT SecurityManagement

ConfigurationManagement

ChangeManagement

ReleaseManagement

Page 10: Incidens-, probléma-, változáskezelés

Eseménykezelés (ism) ITIL: Event Management

o „Event Management is the process of raising significant infrastructure events and responding to those events.”

Fogalmak:o Szűrés (filtering)o Továbbítás (forwarding)o „Lassítás” (throttling)o Duplikátumok detektálása (duplicate detection)o Korrelációo Elévültetéso Metrikák (példa?)

Page 11: Incidens-, probléma-, változáskezelés

Eseménykezelés ism. Generálás Detektálás Szűrés Akció

o Automatikus / humáno Loggoláso Eszkalálás

• Incidenskezelés• Problémakezelés• Változáskezelés

Felülvizsgálás Lezárás

Page 12: Incidens-, probléma-, változáskezelés

Menedzsment folyamatok

Event Management

IncidentManagement

ProblemManagement

Service DeskFunction

CapacityManagement

AvailabilityManagement

Service LevelManagement

IT ServiceContinuity

Management

IT SecurityManagement

ConfigurationManagement

ChangeManagement

ReleaseManagement

Page 13: Incidens-, probléma-, változáskezelés

Service Desk Felület a felhasználók felé Ide fordulnak zavar esetén

Ticket nyitása, kitöltése, lezárása Kísérlet a probléma megoldására Eszkalálás

Aliasok(?)o Call Center, Help Desk, …

Page 14: Incidens-, probléma-, változáskezelés

Menedzsment folyamatok

Event Management

IncidentManagement

ProblemManagement

Service DeskFunction

CapacityManagement

AvailabilityManagement

Service LevelManagement

IT ServiceContinuity

Management

IT SecurityManagement

ConfigurationManagement

ChangeManagement

ReleaseManagement

Page 15: Incidens-, probléma-, változáskezelés

ITIL – Incidenskezelés Incidens:

o Nem tervezett leállás, hiba vagy anomália egy szolgáltatásban (vagy komponensben)

Formalizált incidenskezelés előnye:o Kevesebb leálláso Priorizálás, jobb erőforrás kihasználáso Szolgáltatási szint javítása

Folyamatok, szerepkörök, felelősségek definiálása

Page 16: Incidens-, probléma-, változáskezelés

Táblánál: Incidenskezelés házilag

Page 17: Incidens-, probléma-, változáskezelés

Incidenskezelés – Alfolyamatok Azonosítás

o Milyen forrásokból jöhet?• Event Mgmt• Web Service Interface• Telefonhívás kívülről• Belülről

Naplózás (mit is?)o ID, Időbélyego Probléma leíráso Érintettek száma, súlyosság, prioritáso Kontakt (visszahívási szám)o Vonatkozó CI adatok (!)o Status (?)

Incident identification

Logging

Page 18: Incidens-, probléma-, változáskezelés

Incidenskezelés – Alfolyamatok (2) Kategorizálás

o HW / SW …o Granularitás változó

Priorizáláso Impact on Businesso Hány ember érintett?o Anyagi, személyi, erkölcsi (?) kár

(Initial) Diagnóziso Kísérlet a hibaok feltárására

Categorization

Prioritization

Initial Diagnosis

Page 19: Incidens-, probléma-, változáskezelés

Incidenskezelés – Alfolyamatok (3) Eszkalálás

o Updateljük a ticketet o Továbbítjuk felsőbb szintekreo 2-level, 3-level

Diagnózis felállításaoMi romlott el? oMi vezetett ide?o Okok, eseménysorok megértéseo Known Error Ticket(ek) frissítése

Escalation?

Diagnosis

Page 20: Incidens-, probléma-, változáskezelés

Incidenskezelés – Alfolyamatok (4) Helyreállítás

o Teszteléso Végrehajtás (hol?)

Incidens lezárásao Ticket útjának ellenőrzéseo Visszajelzéso Dokumentálnio Újra előfordulhat

Resolution &Recovery

IncidentClosure

Page 21: Incidens-, probléma-, változáskezelés

Incideskezelés – Ticket állapotai Opened Assigned Resolved Closed

Opened Assigned

Resolved Closed

Page 22: Incidens-, probléma-, változáskezelés

Prioritás Prioritás = sürgősség x hatás

Ökölszabály: Impact = érintettek száma (?)

Példák:o Backup elromlott (nem sürgős, nagy „impact”)o Logo nem szép (sürgős, közvetlen hatás nincs)

Page 23: Incidens-, probléma-, változáskezelés

Gondolkodtatók Milyen metrikákat mérhetünk?

o Ticket/óra, Ticket hossz, … Milyen más folyamatokkal van együttműködés?

o Esemény, probléma, változáskezeléso Konfigurációkezeléso…

Kritikus pontoko Known Error Ticketek kezeléseo Incidensek észleléseo Képzett csapat o Elkötelezettség a felhasználók részéről (!)

Page 24: Incidens-, probléma-, változáskezelés

Menedzsment folyamatok

Event Management

IncidentManagement

ProblemManagement

Service DeskFunction

CapacityManagement

AvailabilityManagement

Service LevelManagement

IT ServiceContinuity

Management

IT SecurityManagement

ConfigurationManagement

ChangeManagement

ReleaseManagement

Page 25: Incidens-, probléma-, változáskezelés

ITIL – Problémakezelés Probléma:

o Incidens(ek) oka Problémák életciklusát kezeli

o Szisztematikusan Incidensek számát / hatását minimalizálja

o Hibaok feltárásaoMegoldás keresése, tesztelése, implementálása

Szoros integráció az incidenskezeléssel és a változáskezeléssel

Page 26: Incidens-, probléma-, változáskezelés

Problémakezelés Folyamat incidenskezeléshez hasonló:

o Detektálás• Hogyan (itt kezd érdekes lenni)?

o Loggoláso Kategorizáláso Priorizáláso DiagnózisoWorkaroundok, megoldás tesztelése, implementálásao Known Error Ticket létrehozása, dokumentáláso Lezárás

Page 27: Incidens-, probléma-, változáskezelés

Demo Ticketek

oMit tartalmaz?o Terminológia

Ticket állapotváltáso Jelzés (e-mail)

Munino Ticketek számának változása

• Open / Closed / All

Trac, Munin

Page 28: Incidens-, probléma-, változáskezelés

Tartalomjegyzék – kis kitérő Probléma / motiváció Eseménykezelés (ism.) Incidenskezelés Problémakezelés Konfigurációmenedzsment (ism) Hatásanalízis / diagnosztika Változáskezelés

Demo

Page 29: Incidens-, probléma-, változáskezelés

CMDB architektúra séma (ism)

Data Provider

Data Consumer

Interface

Interface

CMDB

Data Consumer

Data Provider

Klasszikusconsumer – provider

CMDB központi adatház Szabványos Interfészek Konf. mgmt. körülöleli

Cserélhető eszközök

Page 30: Incidens-, probléma-, változáskezelés

Konfigurációkezelés

CMDB architektúra (ism)

CMDB

IT infra-struktúra

Beépített szenzorok

Külső szenzorok

Vizuali-záció

Monitorozás

Egyéb eszközök

Másik DB

* Menedzsment

Query interface

Page 31: Incidens-, probléma-, változáskezelés

Modell (példány)

rome152.66.252.250

10.10.10.254

vegas10.10.10.3Külső web

sicily10.10.10.1

DHCP, AD Server

chicago10.10.10.2Belső web

florenceDHCP

donDHCP

naplesDHCP

10.10.10.10255.255.255.0

Page 32: Incidens-, probléma-, változáskezelés

(Logikai) Infrastruktúra Modell

Page 33: Incidens-, probléma-, változáskezelés

MatematikaiModell

Analízis

Matematikai analízis

Modell vezérelt analízis és visszacsatolás (ism)

Middle-ware

ModellCMDB

Mérnöki ModellAutomatizált

modell generálás

Page 34: Incidens-, probléma-, változáskezelés

Hatásanalízis (Impact Analysis) Inf. térkép a CMDB-ből:

o Elemek és kapcsolataiko Pl. A függ B től

Komponens hiba kihat-e aszolgáltatásra?o Hány embert érint?

Szolgáltatás leállását melykomponens hibák okozhatják?o Tfh. ismert egyes komponensek állapota

Page 35: Incidens-, probléma-, változáskezelés

Menedzsment folyamatok

Event Management

IncidentManagement

ProblemManagement

Service DeskFunction

CapacityManagement

AvailabilityManagement

Service LevelManagement

IT ServiceContinuity

Management

IT SecurityManagement

ConfigurationManagement

ChangeManagement

ReleaseManagement

Page 36: Incidens-, probléma-, változáskezelés

Változás Nem megtervezett változás következményei:

o Szinkron megszűnik a valóság és a CMDB közötto Nem tervezett leállásoko Bevezetés nem sikereso Késéseko HotFixek

Page 37: Incidens-, probléma-, változáskezelés

Változáskezelés Változások életciklusát kezeli (meglepő)

o Változások káros hatásainak kiküszöböléseo Folytonos(abb) üzletmenet biztosításao Erőforrások hatékony kihasználásao Szisztematikus, folyamatvezérelto CMDB szinkronban tartása

o Business impact meghatározásao Scope behatárolása (érintettek értesítése, bevonása)o Incidensek elkerülése (változás miatti ~)

Page 38: Incidens-, probléma-, változáskezelés

Változáskezelés – kulcsfaktorok(minden ITIL folyamatra igaz, különösen a erre) Vállalati kultúra Prioritások figyelembevétele Jogosultságok, felelősségek tisztázása Kockázatok kézben tartása

Page 39: Incidens-, probléma-, változáskezelés

Változáskezelés

Assess change

Approve / reject

Implementation

Review change

Close change

RFC

Identity affected

items

Update records

Capture baselines

Audit items

Check records updated

Reports & audits

Release & deploy

CMDBKonfiguráció

Menedzsment

VáltozáskezelésRequest For

Change(nem)változtatás

hatása, rizikó, ütemezés

Go / NogoImplementálás koordinálása ÉrtékelésLezárás

Sanyi dolgozik

Page 40: Incidens-, probléma-, változáskezelés

Változáskezelés – összefoglalás Világosan látni kell:

o Ki kezdeményezte a változást?oMiért?oMi a profit?o Rizikó?o Erőforrásigénye?o Felelősök (teszt, implementálás)?o Van kapcsolat más „objektumokkal”(?)?

Page 41: Incidens-, probléma-, változáskezelés

Összefoglalás Esemény-, incidens-, probléma-, változáskezelés

o Szisztematikus folyamato Jórészt automatizálto Service Desk által támogatotto Szakértői csapat bevonásávalo CMDB-t igénybe vevő

• Hatásanalízis• Diagnosztika• …

Reaktív / Proaktív

Page 42: Incidens-, probléma-, változáskezelés