Upload
dinhtuong
View
214
Download
0
Embed Size (px)
Citation preview
Oracle MinilessonAprenda de los mejores
Mejores Practicas para Implementar Ambientes de Misión Critica
Con el auspicio de:
Martín Cabarique
Agenda
• Estrategia
• Opciones con Oracle 11g R2– Oracle HA infraestructure
– Snapshot Stanby Databases
– Oracle Performance Analyzer
– Oracle Database Reply
–
– Oracle Active Dataguard
– Oracle Real Application Clusters
– Oracle RAC One Node
– Oracle Recovery Advisor
• Servicios Disponibles
• Conclusiones & Cierre
Estrategia
Siete factores clave para implementar ambientes
de misión crítica:
• Analisis de riesgo e impacto al negocio
• No hable mas de su estrategia como un
programa de IT o bajo objetivos de IT.
• Su plan de continuidad debe estar integrado a
los procesos del negocio
• Enfoquese hacia la continuidad de los procesos
Estrategia (Cont.)
• Haga un plan a tres años que muestre los
avances en el tiempo, por ejemplo, reduciendo
riesgos, acelerando el tiempo de recuperacion,
reduciendo la taza de errores, etc.
• Asegure que su estrategia no dependa de unas
pocas personas entrenadas.
• Haga pruebas periodicas
Referencia: Linda Tucci, Senior News Writer - SearchCIO.com
Oracle HA Infraestructure
Administración automática de la infraestructura de
la base de datos.
Incluido en todas las versiones
Pequeño Clusterware para un solo servidor
Comandos similares a RAC
Srvctl start asm
Srvctl start listener
Srvctl start database -d rp
Recuperación inmediata de fallas del Listener,
ASM y Base de Datos.
Administre su Ambiente de Pruebas
Usando Snapshot Standby Databases
Physical standby database
Perform testing
Snapshot standby database
Open
database
Back out
changes
SQL> ALTER DATABASE CONVERT TO SNAPSHOT STANDBY;
Redo
stream
Redo
stream
SQL Performance Analyzer
SQL Performance Analyzer es util en casos como los siguientes:
– Database upgrades
– Implementation of tuning recommendations
– Schema changes
– Statistics gathering
– Database parameter changes
– OS and hardware changes
SQL Performance Analyzer:
Como usarle
– Capture la Carga en Producción
– Traslade la Carga a un ambiente de pruebas
– Obtenga estadísticas iniciales de desempeño
– Haga los cambios previstos
– Obtenga las estadísticas de desempeño
posteriores a los cambios
– Compare los dos resultados
– Afine los SQL desfavorecidos por los
cambios
Para que usar Oracle
Database Reply
• La mayor parte de fallas en el servicio se debe a cambios en los sistemas (software y hardware)
• Necesidad de identificar el impacto de los cambios antes de hacerlos
en producción
• Las pruebas exhaustivas son muy costosas y el éxito de las mismas
bajo
– Muchas fallas no son detectadas
– Cambios pueden afectar el desempeño y disponibilidad de las Aplicaciones
• Causa del bajo éxito de las prueba:
– Imposible hacer pruebas de carga reales dejando muchos fallas sin
detectar.
• Database Replay hace posible hacer pruebas realesCopyright © 2007, Oracle. All rights reserved.
Vista Global de RAT
Production
databaseDatabase
backup
Capture directory
Shadow capture file
Shadow capture file
Shadow capture file
Shadow capture file
Pro
ce
ss
ca
ptu
re f
ile
s
Database
restore
Prechange production system Postchange test system
Replay
system
Can use Snapshot Standby as test system
Test
system
with
changes
Production
system
Clients/app servers
Copyright © 2007, Oracle. All rights reserved.
Que es ?
Oracle DataguardProducción
Redo Shipping
Movimiento Automático
Standby
Físico
Centro de Respaldo
• Solución para Protección ante desastres
• Mantenimiento de Standby Fisico en forma automática
• Switchover y Failover
• Compresion en la red
• Soportado en Versiones Standard y Standard Edition One
• Recuperación de los servicios en
menos de 10 minutos
• Protege su activo mas valioso: la
información.
• Eficiente uso de la red (compresión)
• Activo/Pasivo
• Excelente relación costo/beneficio
• Transparente a las aplicaciones
Que es Oracle Dataguard?
Oracle DataguardProducción
Redo Shipping
Movimiento Automático
Standby
Físico
o
Lógico
Centro de Respaldo
• Solución para Protección ante desastres
• Mantenimiento de Standby Fisico o Lógico en forma automática
• Switchover y Failover
• Compresion en la red
Active Dataguard
• Anteriormente la Base Standby podia estar en
dos modos mutuamente excluyentes:
– Modo de Recuperacion: se estan aplicando los
cambios
– Modo de Solo Lectura
• Active Dataguard en 11g
– Permite mantener la BD standby abierta para lecturas
al tiempo que se aplican los cambios sobre la BD
Que es Oracle Real
Application Clusters RAC?
– Multiples instancias
accediendo a la misma
Base de Datos
– Instancias repartidas
entre los servidores
– Acceso Físico a cada
uno de los archivos de
la BD
– Software controla en el
acceso a los datos
Instances run on each node
Database
files
Interconnect
Copyright © 2007, Oracle. All rights reserved.
Porque usar RAC?
– Alta Disponibilidad: Servicio se mantiene
durante caidas del servidor o de instancias
– Escalabilidad sin Limites: Adicione mas nodos
cuando los necesite
– Pay as you grow: Pay for just what you need
today
– Beneficios mas importantes de Grid Computing:
• Crezca o Redistribuya bajo demanda
• Un solo boton para adicionar o remover servidores
• Distribución automática de la carga y recursos
• Founded in March 1994
• Part of Mobilcom Austria Group
• Telecom leader in Bulgaria
• First production implementation on Oracle 11g GRID
• Best Exadata v1 Performance Results
• First successful Exadata v1 custom installation
• First Customer to run OLTP on Exadata v1
Case Study: M-Tel
Referencia: NEW: Oracle Real Application Clusters (RAC) and Oracle Clusterware 11g Release 2 Por:Philip Newlan, Oracle RAC Pack
M-Tel’s vs. DB Admins’ Challenges
• Provide highest quality of service– Make every application
• highly available
• scalable
• dynamically manage application workload
• Be more flexible– Online maintenance
– Service relocation
• Do more with less– Consolidate, simplify, automate
Referencia: NEW: Oracle Real Application Clusters (RAC) and Oracle Clusterware 11g Release 2 Por:Philip Newlan, Oracle RAC Pack
Problemas para adoptar
RAC• Unable to load balance between databases
on the same node
• Most applications cannot share the same database (they aren't 100% isolated)
• Some applications aren’t certified with RAC
• No unified approach for single instance database failover. Difficult database movement between servers
• No automatic actions in the event of node failure
Referencia: NEW: Oracle Real Application Clusters (RAC) and Oracle Clusterware 11g Release 2 Por:Philip Newlan, Oracle RAC Pack
• Omotion DB-A from Node 1 to Node 8
• Failover DB-B from Node 2 to Node 9
• Rolling Patches DB-C Node 3 and Node 2
• Online Upgrade DB-C to multi-node RAC instances
Oracle Database 11g Release 2
RAC ONE – A grid of virtualized single instance databases
Resumen — Beneficios RAC One Node:
• Better virtualization for databases– Consolidation, workload management, Better HA
– Plus, online maintenance, and DB failover
• Better cluster failover– Additional value (online migration, online
maintenance)
– Single-vendor solution
• Ready to scale– Online upgrade to multi-node RAC
• Standardized Environment– Common toolset for both single-node and multi-
node Oracle database deployments
Data Recovery Advisor
– Rápida determinación, análisis y recuperación de
fallas
– Minimiza tiempos de parada
– Puede Implementarse con:
• Enterprise Manager
• RMAN command line
4. Choose and execute repair.
3. Advise on repair.
5. Perform proactive checks.
2. List failures by severity.
1. Assess data failures.
Oracle MinilessonAprenda de los mejores
Administración al MinutoQue hacer cuando su BD esta en emergencia?
Con el auspicio de:
Martín Cabarique
Agenda
• Introducción
• Arquitecturas recomendadas
• Planes de acción
• Herramientas Disponibles– Sitio Alterno
– Clusterización
– Recovery Manager
– Grid Control
– SQL*Plus
Introducción
Emergencia es todo imprevisto que afecta la
disponibilidad de los servicios de la Base de
Datos, como:– Crisis de desempeño
– Corrupción física de la Base de Datos
– Corrupción lógica de la información
– Aparición de Bugs
– Cambios imprevistos en comportamiento de
aplicación
– Caida de la red
– Caida de un servidor de Aplicaciones
Introducción
El procedimiento ante emergencias depende de
los siguientes factores:– Arquitectura en la que se encuentra implementada
la Base de Datos
– Plan activo de recuperación ante desastres
– Herramientas implementadas para el monitoreo y
pruebas
La velocidad y calidad del resultado es
directamente proporcional a la calidad de la
arquitectura implementada.
Arquitecturas Recomendadas
– Oracle Real Application Clusters
Instances run on each node
Databasefiles
Interconnect
Arquitecturas Recomendadas
–
DBTwiceProduction Site
Redo Shipping
Automatic TransportPhysical Standby
Active Recovery Center
Planes de Acción
– Base de Datos Caida
• Primero recupere los servicios, luego diagnostique
– Cambios a la BD de producción
• Pruebe los mismos antes de su implementación
• Mantenga copia de la versión anterior
– Crisis de Desempeño
• Mantenimiento predictivo
• Implementación Resource Manager
• Tome una imagen del estado actual de la BD
• Detecte la causa
• Si degradación general, kill de la sesion causante
• Si RAC, reubique los servicios afectados
Planes de Acción
– Corrupción física de datafiles
• Use sitio alterno
• Recupere los bloques dañados
• Use image copy de datafiles dañados
• Restaure y recupere los datafiles dañados
• Cargue los datos nuevamente de un import
– Corrupción lógica de la BD
• Flashback de las tablas, transacciones o BD
dañadas
• Recupere de sitio alterno
• Recupere de un export
Planes de Acción
– Corrupción física de Current Redolog
• Use sitio alterno.
• Recuperación incompleta de la BD con rman.
• Restauración de último export disponible.
– Corrupción de Controlfile
• Use sitio alterno.
• Si multiplexado, intente subir de uno en uno.
• Recupere controlfile de backup.
• Recree Controlfile
– Bug de la Base de Datos
• Si fallo en SQL específico, implemente SQL Patch.
• Diagnóstico con Metalink.
Sitio Alterno Administrado conOracle Dataguard
– Implemente Fast Start Failover
• Recuperación automática entre 20seg y 1min
Primary database
Fast-start failover standby database
Observer
Loss of connectivity >fast-start failover threshold
Oracle Real Application Clusters
– Evite crisis de desempeño con:
• Servicios
• Resource Manager
• Distribución de carga entre nodos
– Oracle Clusterware
• Recuperación automática de caidas de la BD
– ASM Cluster File System
• Clusterización de aplicaciones de terceros
• Versionamiento de aplicaciones
Oracle HA Infraestructure
– Incluido en todas las versiones
– Recuperación automática y en segundos de:
• Base de Datos Caida
• Falla del ASM
• Listener Caido
Oracle Recovery ManagerRMAN
– Integrado con Oracle Active Dataguard
• Recuperación automática y transparente a usuarios
de bloques corruptos
– Diagnóstico de fallas en la Base de Datos
– Generador de soluciones ante fallas
– Integrado con Librería de Cintas
• Elimina participación humana en recuperación desde
cintas
– Integrado con Oracle Express Backup, incluido en todas las
versiones
Oracle Enterprise ManagerGrid Control
– Incluido en todas las versiones
– Con Tuning y Diagnostic Pack se tiene:
• Generación proactiva de alertas de BD y Servidor
• Afinamiento proactivo de la instancia
• Almacena historia de las sesiones consumidoras de
recursos y generadoras de contención
• Afinamiento automático de sentencias SQL
• Facilita el diagnóstico en escenarios de ―congelación‖ de
la BD a través del monitoreo directo del SGA
Oracle SQL*Plus
– Cuando las herramientas gráficas no están disponibles, esta
es su salvación
– Documente sus scripts de diagnóstico
– Explore en la Web, hay muchos ya hechos
– Agrúpelos por temas
• Bloqueos entre usuarios
• SQLs consumidores de recursos
• Sesiones consumidoras de recursos
• etc
En resumen
• Sea proactivo
• El resultado es tan bueno como la arquitectura y las medidas
de alerta temprana
• Entrenese, el conocimiento es indispensable para los primeros
auxilios y el mantenimiento de buenos niveles de servicios
• Mantenga un soporte de calidad para atención predictiva y las
eventualidades que puedan presentarse
Estamos Para Servirlos y Queremos Servirlos Bien!
• Consultoría especializada y experimentada en asegurar la
continuidad de su negocio.
– Real Application Clusters.
– Oracle Dataguard.
– dbTwice.
• Asistencia antes, durante y posterior a la implementación de
ambiente para Recuperación ante Desastres.
• Mantenimiento Predictivo y Correctivo.
• Transferencia de conocimiento.
• Centro de soporte 24x7.
Para mayor información por favor contáctenos:
Ricardo Cárdenas
Germán López
T: +51 1 6401000