Upload
others
View
6
Download
0
Embed Size (px)
Citation preview
IT-Symposium 2007 18.04.2007
www.hp-user-society.de 1
<Insert Picture Here>
Oracle DataGuard - Automatisches UmschaltenMike DietrichPrincipal Sales Consultant
IT-Symposium 2007 18.04.2007
www.hp-user-society.de 2
Oracle DataGuard Überblick
Agenda
Automatic Fast Start Failover
Weitere Überlegungen zu FSFO
Was eine Standby sonst noch so alles kann
Testergebnisse, Quellen, Informationen
Oracle DataGuard Überblick
Agenda
Automatic Fast Start Failover
Weitere Überlegungen zu FSFO
Was eine Standby sonst noch so alles kann
Testergebnisse, Quellen, Informationen
IT-Symposium 2007 18.04.2007
www.hp-user-society.de 3
• Desaster Recovery Lösung für Oracle DB's
• Kostenfreies Feature der Oracle Enterprise Edition
• Aber: Standby-Seite muss analog zu PROD lizenziert werden - auch, wenn es sich um eine Standby ohne Dataguard handelt!!!
• Automatisiert das Anlegen und den Betrieb einer oder mehrerer Standby-Datenbanken
• Ausfall der Produktionsdatenbank� Standby-Datenbank übernimmt
• x1000km Entfernung möglich
Oracle DataGuard
Primary Primary SiteSite
Clients
Standby Standby SiteSite
Log InformationenLog Informationen
Broker Agent B
roker Agent
Data Guard Broker
Clients
Backup
DI G I TAL DATA STO RAG E
Failover/SwitchoverFailover/Switchover
Gap DetectionGap Detection
Protection ModesProtection Modes
No Data LossNo Data Loss
Oracle DataGuard
IT-Symposium 2007 18.04.2007
www.hp-user-society.de 4
• 2 Typen von Standby-Lösungen
• Physical Standby
• Redolog-Dateien werden recovert
• Entweder Recovery Modus oder Read-Only
• Blockidentische Kopie der Produktionsdatenbank
�Desaster Recovery (Failover)
• Logical Standby
• Redolog-Dateien werden extrahiert
• SQL-Statements werden auf die Standby angewendet
• Logische Kopie der Produktionsdatenbank
�Online Reporting, Rolling Upgrades
Oracle DataGuard
• 3 Möglichkeiten zur Administration• Pures SQL• DataGuard Broker und DGMGRL
• DataGuard Broker und EM GridControl
Oracle DataGuard
IT-Symposium 2007 18.04.2007
www.hp-user-society.de 5
Oracle DataGuard - Redo Transport
Online
Redo
Logs
Archived
Redo Logs
Production
Database
Transactions
LGWR
ARCH
Production
RFS
Standby
Redo
Logs
Archived
Redo
Logs
LGWR
SYNCLNS
Standby
ARCH
LGWR ASYNCLNS RFS
RFS
Gap
Resolution
Oracle DataGuard - Apply Services
Standby
Redo Logs
Archived
Redo Logs
Standby
Physical(Redo Apply)
Logical(SQL Apply)
Apply
Redo
Data
From
Site A
Standby
DatabaseARCH
RFS
IT-Symposium 2007 18.04.2007
www.hp-user-society.de 6
• Engere Synchronisation der Standby mit der Poduktivdatenbank
• Up-to-Date Echt-Zeit-Reporting
• Schnelles Switchover und Failover• Verringert geplante und ungeplante Ausfallzeiten
• SQL> ALTER DATABASE RECOVER MANAGED STANDBY DATABASE
• USING CURRENT LOGFILE; Physical Standby
• SQL> ALTER DATABASE START LOGICAL STANDBY APPLY
IMMEDIATE; Logical Standby
Oracle DataGuard - Real Time Apply
Oracle DataGuard Überblick
Agenda
Automatic Fast Start Failover
Weitere Überlegungen zu FSFO
Was eine Standby sonst noch so alles kann
Testergebnisse, Quellen, Informationen
IT-Symposium 2007 18.04.2007
www.hp-user-society.de 7
• Übersicht• Automatisiertes, schnelles Umschalten auf eine Standby-
Datenbank ohne Intervention von aussen
• Mögliche Re-Instantiierung der ehemaligen Produktions-datenbank als neue Standby nach einem Failover
• Vorraussetzungen:• Nutzung des DataGuard Brokers
• DGMGRL
• GridControl
• Maximum Availability Mode• LGWR SYNC AFFIRM und ZeroDataLoss
• Flashback Database
DataGuard - Fast Start Failover
• Ausgangsszenario:• Physical Standby Umgebung mit Dataguard Broker
• Real-Time-Apply für schnelles Failover
DataGuard - Fast Start Failover
STANDBYPRODClients
LGWR SYNC
Broker Agent
Broker Agent B
rokerAgent
BrokerAgent
Data Guard BrokerData Guard Broker
IT-Symposium 2007 18.04.2007
www.hp-user-society.de 8
• Observer aufsetzen (mit TNS) und in Broker einbinden• OS darf ungleich Standby-Konfiguration sein
• Oracle-Client-only Installation
DataGuard - Fast Start Failover
LGWR SYNC
Broker Agent
Broker Agent B
rokerAgent
BrokerAgent
Data Guard BrokerData Guard Broker
STANDBYPRODClients
• Ausfall des Produktionssystems
DataGuard - Fast Start Failover
LGWR SYNC
Broker Agent
Broker Agent B
rokerAgent
BrokerAgent
Data Guard BrokerData Guard Broker
STANDBYPROD
????
????
IT-Symposium 2007 18.04.2007
www.hp-user-society.de 9
• Observer stellt Fehlerzustand fest• Timeout (per Default 30sec.)
• Observer prüft, ob STANDBY synchronisiert ist
DataGuard - Fast Start Failover
LGWR SYNC
Broker Agent
Broker Agent B
rokerAgent
BrokerAgent
Data Guard BrokerData Guard Broker
STANDBYPROD
• Observer leitet den Fast Start Failover ein• Clients verbinden sich auf neue PROD (TAF bzw. FAN)
DataGuard - Fast Start Failover
LGWR SYNC
Broker Agent
Broker Agent B
rokerAgent
BrokerAgent
Data Guard BrokerData Guard Broker
STANDBYNeue PRODClients
IT-Symposium 2007 18.04.2007
www.hp-user-society.de 10
• Observer reinstantiiert die ehemalige PROD• Flashback der ehemaligen PROD
• Konvertierung in eine Standby
DataGuard - Fast Start Failover
LGWR SYNC
STANDBYNeue PRODClients
STANDBY
Broker Agent
Broker Agent B
rokerAgent
BrokerAgent
Data Guard BrokerData Guard Broker
LGWR SYNC
• Kontrollierten Rollentausch (Switchover) durchführen• Clients verbinden sich wieder auf neue/alte PROD
DataGuard - Fast Start Failover
LGWR SYNC
Broker Agent
Broker Agent B
rokerAgent
BrokerAgent
Data Guard BrokerData Guard Broker
STANDBYPRODClients
IT-Symposium 2007 18.04.2007
www.hp-user-society.de 11
Oracle DataGuard Überblick
Agenda
Automatic Fast Start Failover
Weitere Überlegungen zu FSFO
Was eine Standby sonst noch so alles kann
Testergebnisse, Quellen, Informationen
• Wo soll der Observer aufgesetzt werden?
DataGuard FSFO - Weitere Überlegungen
LGWR SYNC
Broker Agent
Broker Agent B
rokerAgent
BrokerAgent
Data Guard BrokerData Guard Broker
STANDBYPRODClients
IT-Symposium 2007 18.04.2007
www.hp-user-society.de 12
• Der Observer gehört weder auf PROD noch auf STBY!• Evtl. kann der Observer im Standby-RZ betrieben werden
DataGuard FSFO - Weitere Überlegungen
Broker Agent
Broker Agent B
rokerAgent
BrokerAgent
Data Guard BrokerData Guard Broker
STANDBYPRODClients
• Events, die zu einem FSFO führen
• Netzwerkverbindung zwischen Observer und PROD abgebrochen oder PROD ist netzwerkseitig isoliert• Observer wartet Threshold bis zur FSFO-Initialisierung ab
• Instanz-Fehler bei Single Instance bzw. aller Instanzen im RAC• Observer wartet Threshold bis zur FSFO-Initialisierung ab
• Shutdown Abort• Observer wartet Threshold bis zur FSFO-Initialisierung ab
• Datenfile(s) geht/en offline• Observer initiiert den FSFO sofort
DataGuard FSFO - Weitere Überlegungen
IT-Symposium 2007 18.04.2007
www.hp-user-society.de 13
• Events, die nicht zu einem FSFO führen oder diesen verhindern
• Die Netzwerkverbindung zwischen PROD und STANDBY besteht
• Netzwerkverbindung zwischen Observer zur STANDBY ist abgebrochen
• STANDBY ist nicht synchron mit PROD
• PROD wird mit SHUTDOWN NORMAL/IMMEDIATEangehalten
• Wenn ein manueller Failover im Gang ist
DataGuard FSFO - Weitere Überlegungen
• Konfiguration des Observers• FastStartFailoverThreshold=30 [Sekunden - Default]
• DGMGRL> EDIT CONFIGURATION SET PROPERTY
FastStartFailoverThreshold = 15;
• Achtung bei langsamen Netzwerken und bei RAC
• Neustart des Observers• Unterstützt ab EM 10.2.0.1 über den Agent
• Ab EM 10.2.0.3 Neustart auch auf einem anderen Host
• Mehrere Observer auf einem Host• Ja - pro PROD/STBY-Konfiguration 1x Observer-Prozess
• Unterscheidung über unterschiedliche Observer-Datenfiles• DGMGRL> start OBSERVER FILE=$OH/dbs/Konfig1.dat
DataGuard FSFO - Weitere Überlegungen
IT-Symposium 2007 18.04.2007
www.hp-user-society.de 14
• Es kann nur "Einen" geben!!• Kein "Split-Brain" (zwei aktive Seiten), wenn der Observer die
Konfiguration überwacht
DataGuard FSFO - Weitere Überlegungen
PRODClients Neue PROD Clients
• Netzwerk-Transport tunen• Unabhängig von FSFO
• Immer!!!
DataGuard FSFO - Weitere Überlegungen
IT-Symposium 2007 18.04.2007
www.hp-user-society.de 15
Oracle DataGuard Überblick
Agenda
Automatic Fast Start Failover
Weitere Überlegungen zu FSFO
Was eine Standby sonst noch so alles kann
Testergebnisse, Quellen, Informationen
Was eine Standby sonst ...
• Physical Standby Read/Write nutzen• Aktivieren einer PHYS fürs Reporting
> alter database activate standby database;
• Anschließend Flashback zurück (vor dem Öffnen)> flashback database to before resetlogs;
• Einfache Rückkonvertierung in eine Standby> alter database convert to physical standby;
• Dataguard synchronisiert automatisch
• Aber Vorsicht:Kein Logshipping während dieser Zeit und damit keine Absicherung gegen Desaster !!!
• Ausblick:Ab 11g mit gleichzeitigem Logshipping!!!
IT-Symposium 2007 18.04.2007
www.hp-user-society.de 16
Was eine Standby sonst ...
• Rolling Upgrades mit 2min Downtime• Nur mit einer Logical Standby Datenbank
• Daten retten in Sekunden• Disasterbeispiele:
TRUNCATE auf eine wichtige TabelleBatchjob läuft im falschen Userschema ...
• Ziel:Daten wiederherstellen, aber ohne Downtime auf PROD und ohne ein Backup umständlich zu restaurieren
• Vorgehensweise:
1)PHYS mit FLASHBACK STANDBY DATABASE zurückfahren
2)PHYS read-only öffnen
3)Benötigte Daten exportieren
4)Automatische Resynchronisation der Standby
5)Daten auf PROD wieder einspielen
Was eine Standby sonst ...
IT-Symposium 2007 18.04.2007
www.hp-user-society.de 17
• Daten retten in Sekunden
Was eine Standby sonst ...
STANDBYPROD
TRUNCATETRUNCATE FLASHBACK STANDBY DATABASEFLASHBACK STANDBY DATABASE
ALTER DATABASE OPEN READ ONLYALTER DATABASE OPEN READ ONLY
Daten exportierenDaten exportieren
RECOVER MANAGED STANDBY DATABASERECOVER MANAGED STANDBY DATABASE
DataGuard synchronisiert automatischDataGuard synchronisiert automatisch
Daten importierenDaten importieren
� �
�
�
� �
�
Oracle DataGuard Überblick
Agenda
Automatic Fast Start Failover
Weitere Überlegungen zu FSFO
Was eine Standby sonst noch so alles kann
Testergebnisse, Quellen, Informationen
IT-Symposium 2007 18.04.2007
www.hp-user-society.de 18
Testergebnisse
• Datenbank 100GB - einmal Single Instance, einmal RAC
• Redhat Linux 3.0 für DB Server und Observer
• Last von ca. 3MB Redo/sec. (ca. 4,3 GB Redo/Tag)
• Gigabit Ethernet
*
* ohne Threshold-Time
Kundenbeispiel
• 2-CPU 2-Knoten RAC auf Linux mit ASM 10.2.0.1 �10.2.0.2• Datenbank-Upgrade (Standby): 26min
• Switchover: 45sec
• Datenbank-Upgrade (Ex-Prod): 27min
• Switchover: 50sec
• Downtime über alles: 95sec !!!
IT-Symposium 2007 18.04.2007
www.hp-user-society.de 19
Wichtige Quellen
• Oracle®Data Guard Concepts and Administration 10.2Part Number B14239-04
• Oracle®Data Guard Broker 10g Release 2 (10.2)Part Number B14230-02
Weitere Informationen
• OTN White Paper:http://www.oracle.com/technology/deploy/availability/pdf/
MAA_WP_10gR2_FastStartFailoverBestPractices.pdf
IT-Symposium 2007 18.04.2007
www.hp-user-society.de 20
Weitere Informationen
• OTN White Paper:http://www.oracle.com/technology/deploy/availability/pdf/
MAA_WP_10gR2_DataGuardNetworkBestPractices.pdf
Weitere Informationen
• OTN Case Study:http://www.oracle.com/technology/deploy/availability/pdf/
FastStartFailoverProfile.pdf
IT-Symposium 2007 18.04.2007
www.hp-user-society.de 21