View
217
Download
0
Category
Preview:
Citation preview
Christian Stroh
FaultFault--KonzepteKonzepte
Fehlermanagement in Fehlermanagement in RechnernetzenRechnernetzen
Christian Stroh
ÜbersichtÜbersicht1. Rückblick auf
FCAPS (Netzwerkmanagement) undSNMP (Netzwerkprotokoll)
2. Fehlermanagement (Definition, Struktur)3. Fehlerbehandlung
-Fehlererkennung-Fehlerdiagnose-Fehlerbehebung
4. Klassifizierung von Netzwerkmanagementwerkzeugen
5. Fehlerprävention
Christian Stroh
FCAPSFCAPS
• ISO-Modell für Netzwerkmanagement• FCAPS
(Fehler,Konfiguration,Abrechnung,Leistung,Sicherheit)• grosser Teil dieser Aufgaben wird von
Netzwerkmanagementprogrammen unterstützt• IP-Netze werden häufig mittels Netzwerkprotokollen wie
SNMP oder WMI verwaltet und überwacht
Christian Stroh
SNMP SNMP (Simple Network Management Protocol)(Simple Network Management Protocol)(1/2)(1/2)
• Netzwerkprotokoll um Komponenten (Router,Server,Switches,Drucker,Computer usw.) zentral zu überwachen und zu steuern
• Protokoll regelt die Kommunikation zwischen Komponenten und Überwachungsstation
• jede netzwerkfähige Komponente überwachbar• von den meisten Netzwerkmanagementprogrammen
unterstützter Standard
Christian Stroh
SNMP SNMP (Simple Network Management Protocol)(Simple Network Management Protocol)(2/2)(2/2)
mögliche Aufgaben des Netzwerkmanagements mit SNMP:• Überwachung von Komponenten (Monitoring)• Fernsteuerung und Fernkonfiguration von Komponenten• Fehlererkennung und Fehlerbenachrichtigung
Christian Stroh
DefinitionDefinitionFehlerFehler (fault) in einem Netz(fault) in einem Netz
Ereignisse und Zustände, die eine Komponente daran hindern,ihre Aufgabe anforderungsgerecht durchzuführen.
auftretende Fehler:• während der Implementierung der Komponenten• externe Störungen• Verschleiss von Komponenten• Überlastung von Komponenten
Christian Stroh
2. Fehlermanagement2. Fehlermanagement
Das Fehlermanagement hat die Verfügbarkeit einesKommunikationsnetzes möglichst hoch zu halten.Aus dieser Zielvorgabe ergeben sich folgende Teilaufgaben: • Überwachen des Netz- und Systemzustandes• Problemerkennung• Durchführen von Netzwerk- und Komponententests• Entgegennehmen und Verarbeiten von Alarmen• Diagnostizieren von Fehlerursachen• Einleiten und Überprüfung von Fehlerbehebungsmaßnahmen• Fehlerdokumentation• Leisten von Hilfestellung für den Benutzer
Christian Stroh
FehlermanagementFehlermanagement
Ziel: Erhöhung der Verfügbarkeit des Netzwerkes
Mittel: frühzeitiges Erkennen von Fehlersituationenund Bestimmung der Fehlerursachen
Dienste des Fehlermanagements:Sie umfassen Tests zur Überprüfung von Netz-Komponenten, bzw. zur Fehlerlokalisierung. Desweiteren können Fehlermeldungenausgetauscht und Fehlerstatistiken abgerufen werden.
Christian Stroh
Struktur des FehlermanagementStruktur des Fehlermanagement
Christian Stroh
3. Fehlerbehandlung3. Fehlerbehandlung
• Fehlererkennung-Liegt ein Fehler vor oder ist ein Fehler zu erwarten?
• Fehlerdiagnose-Ein Fehler ist aufgetreten. Wodurch wurde er verursacht?
• Fehlerbehebung-Gibt es eine kurzfristige (provisorische) Lösung?-Wie und wann kann der Fehler behoben werden?-Kann man die Nutzer beruhigen?-Ist die Ursache des Fehlers wirklich beseitigt oder tritt er regelmäßig wieder auf?
Christian Stroh
FehlerbehandlungFehlerbehandlungFehlererkennungFehlererkennung
• 3 Arten der Fehlererkennung:-Diagnosetests der Komponenten in zeitlichen Abständen (Polling)-Komponente sendet Fehlermeldung an Manager (Trapping/Alarm)-Anwender meldet Fehler beim Administrator
Christian Stroh
FehlerbehandlungFehlerbehandlungFehlerdiagnoseFehlerdiagnose
• Zur Fehlerdiagnose wird auf die Daten des Konfigurationsmanagements zurückgegriffen.
Christian Stroh
FehlerbehandlungFehlerbehandlungFehlerbehebungFehlerbehebung
• Programme zur Fehlerbehebung werdengestartet oder aber es werden aktive Eingriffeseitens der Administratoren gefordert.
Christian Stroh
FehlerbehandlungFehlerbehandlungFehlerbehebung Fehlerbehebung im Detail (1/2)im Detail (1/2)
Wird ein Fehler entdeckt,so sind die folgenden Schritte rasch auszuführen:1) Fehlerursache feststellen2) Isolation des restlichen Netzwerks von der
Störungsstelle3) Modifikation oder Rekonfiguration des Netzwerks.4) Reparatur oder Austausch der fehlerhaften
Komponenten. Das Netzwerk ist nun wieder in seinem ursprünglichen Zustand.
Christian Stroh
FehlerbehandlungFehlerbehandlungFehlerbehebungFehlerbehebung im Detail (2/2)im Detail (2/2)
Wichtig sind schnelle und zuverlässige Problemlösungen:• zuverlässige Fehlerverwaltungstechniken verwenden• Netzwerk durch redundante Komponenten und
Kommunikationsrouten gegenüber Fehler toleranter machen
Christian Stroh
Fehlerbehandlung im EinsatzFehlerbehandlung im Einsatz
BeispielSchritte um Dienst wiederherzustellen:-Erkennung kein mail-Dienst verfügbar-Identifizierung Link-Ausfall-Isolation zwischen Switch A und Router B-Wiederherstellung Reserve-Link einrichten-Lösung Interface/Kabel prüfen/reparieren-Fall abschliessen Bericht, neu konfigurieren
Christian Stroh
Fehlerhäufigkeit in den OSIFehlerhäufigkeit in den OSI--SchichtenSchichten
Christian Stroh
4. Klassifizierung von 4. Klassifizierung von ManagementwerkzeugenManagementwerkzeugen
Christian Stroh
NetzwerkNetzwerk--MonitoringMonitoring
• Überwachung und Kontrolle von Netzwerken, deren Hardware und Diensten
• externes Monitoring mit zusätzlichem Rechner• aktives Monitoring sendet zusätzliche Pakete ins Netz• Monitoringprogramme nutzen meist das
SNMP-Netzwerkprotokoll• Beispiel: Monitoring-Software RoboMon...
Christian Stroh
ProtokollanalysatorProtokollanalysator
Christian Stroh
RoboMonRoboMon ((MonitoringMonitoring--Software)Software)
• Ausfallzeiten minimieren• plattformunabhängig• netzwerkweite Verwaltung• Berichte und Diagramme
HP HP OpenViewOpenViewNetwork Network NodeNode ManagerManager
(integriertes Netzwerkmanagementprogramm)(integriertes Netzwerkmanagementprogramm)
• bietet die Möglichkeitder Konfiguration,der Fehlersuche undder Überwachungeines oder mehrererTCP/IP-basierender Netze
Christian Stroh
5. Fehlerprävention5. Fehlerprävention(Bekämpfung der Fehlerursachen)(Bekämpfung der Fehlerursachen)
• Monitoring ermöglicht Langzeitmessungen des Lastzustandes,um potenzielle Fehlerquellen (z.B. Leistungsengpässe) im Netz frühzeitig zu erkennen und dem Fehlerereignis präventiv zu begegnen.
• Ausfallsicherheit durch Redundanz der Netzwerk-Infrastruktur.Redundanz bedeutet, dass immer mindestens zwei oder mehr Komponenten (z.B. Server) sich die kritische Last gleichmässig aufteilen. Bei Ausfall einer Komponente übernimmt die andere unterbrechungsfrei die gesamte angeschlossene Last.
• Benutzer-Berechtigungen einschränken.
Christian Stroh
QuellenQuellen• http://einstein.informatik.uni-oldenburg.de/lehre/semester/rechnernetze/05ss/daten/RN2-NetzwerkManagement.pdf• http://einstein.informatik.uni-oldenburg.de/rechnernetze/seite121.htm• http://www.net.informatik.tu-muenchen.de/teaching/former/notes/Jessen_Rechnernetze_WS99.ps• http://www.bs.informatik.uni-siegen.de/web/wismueller/vl/ws06/rn2/v10_4.pdf• http://www.bs.informatik.uni-siegen.de/web/wismueller/vl/ws06/rn2/v10.pdf• http://de.wikipedia.org/wiki/Fehlermanagement• http://www-rnks.informatik.tu-cottbus.de/de/materials/ws2002vlrnksI/Folien_2_7_Studenten.pdf• http://www.internet-sicherheit.de/fileadmin/npo/vorlesungen/nwm/Einfuehrung_NWM_06_10_05.pdf• http://ls4-www.cs.uni-dortmund.de/home/maeter/Toplehre/PG380/PG380.Antrag.pdf• http://www.sws.bfh.ch/~lanz/SKRIPTE/DataKomm.pdf• http://www.rn.inf.tu-dresden.de/scripts_lsrn/Lehre/prosem_rn/print/print_ss05/Netzwerkmanagement.pdf• http://www2.fht-esslingen.de/~thkiit02/Semester5/Netzwerkmanagement/Vorlesungen/NM_03_ASN1_060323_55914.pdf• http://home.datacomm.ch/felix_fischer/data/Seminararbeit_Nw.pdf• http://net.informatik.uni-tuebingen.de/fileadmin/RI/teaching/seminar_iit/ws0304/slides/slides-baumeister.pdf• http://www.martinnet.de/studium/rechnernetze/RN8.pdf• http://209.85.135.104/search?q=cache:s-r_PgnF0SQJ:www.cs.fhm.edu/~ifw00245/dako/Dako.doc+rechnernetze+fehlermanagement&hl=de&gl=de&ct=clnk&cd=60• http://geb.uni-giessen.de/geb/volltexte/2004/1690/pdf/Apap_WI_1997_03.pdf• http://www.info-fhb.de/haupt/datentonne/scriptz.htm• http://home.in.tum.de/~velev/projects/rnp/rnp_nm1.pdf• http://209.85.129.104/search?q=cache:7l54AgGtYe4J:www.computerwoche.de/heftarchiv/1985/30/1170163/+rechnernetze+fehlermanagement&hl=de&gl=de&ct=clnk&cd=98• http://de.wikipedia.org/wiki/OSI-Modell• http://www.infotech.tu-chemnitz.de/~knoll/studienarbeit.pdf• http://de.wikipedia.org/wiki/Error-correcting_code• http://209.85.129.104/search?q=cache:OAk5jlaksuIJ:pi.informatik.uni-siegen.de/akkred/m_ti2005/m_ti2005_mhb_a4.ps+rechnernetze+fehlermanagement&hl=de&gl=de&ct=clnk&cd=110• http://en.wikipedia.org/wiki/Fault_management• http://www.pse.siemens.at/apps/pseauftritt/ge/pseinternet.nsf/CD_Index?OpenFrameset&Bookmark&/0/PK216BBA0E18A07FA8C12569EE003A472F• Zeitschrift LANline 4/2001• http://www.itwissen.info/definition/lexikon//_fmfm_fmfault%20management%20fm_fmfehlermanagement.html• http://www.tm.uka.de/lehre/WS0102/vorlesungen/Telematik/tm10-ka.pdf• http://lexikon.freenet.de/• http://de.wikipedia.org/wiki/Simple_Network_Management_Protocol• http://www.ifi.unizh.ch/ikm/Vorlesungen/KommSeminar00/KommSeminar00/Documents/NetzwerkmgmtSlides.pdf• http://www.nagios-wiki.de/lib/exe/fetch.php/workshop/2006/vortraege/2006-03-nagios-einfuehrung.pdf?id=workshops%3A2006%3Astart&cache=cache• http://www.nagios-wiki.de/lib/exe/fetch.php/workshop/2006/vortraege/2006-03-nagios-workshop.pdf?id=workshops%3A2006%3Astart&cache=cache• http://www.its.bth.se/courses/etb017/material/NM2h.pdf• http://www.rrzn.uni-hannover.de/fileadmin/ful/vorlesungen/rechnernetze_2/ss_06/Rechnernetze_II_1_SS06.pdf• http://www.msexchangefaq.de/konzepte/snmpbasics.htm• http://www.ztt.fh-worms.de/en/others/sem/ss96/hellwig_snmp/snmp.html• http://www.elektronik-kompendium.de/sites/net/0902011.htm• http://de.wikipedia.org/wiki/HP_OpenView• http://www.infotech.tu-chemnitz.de/~knoll/HP/hp_index.html• http://www.computerwoche.de/index.cfm?pid=432&pk=1135362• http://www.lampertz.de/html/default.asp?site=1_8_16
Literatur:Token Ring Netzwerke, Frank Kresse, Hüthig Buch Verlag HeidelbergEthernet, Mathias Hein, Thomson PublishingLAN/WAN Troubleshooting, Othmar Kyas, mitpIntegriertes Management vernetzter Systeme, Heinz-Gerd Hegering, Sebastian Abeck, Bernhard Neumair, dpunkt.verlag
Christian Stroh
Vielen Dank für Eure Aufmerksamkeit!
Recommended