47
Oracle Minilesson Aprenda de los mejores Mejores Practicas para Implementar Ambientes de Misión Critica Con el auspicio de: Martín Cabarique

Oracle Minilesson Aprenda de los mejores Mejores … DB11g Options.pdf · 2010-09-17 · Oracle Minilesson Aprenda de los mejores ... Comandos similares a RAC ... •Better cluster

Embed Size (px)

Citation preview

Oracle MinilessonAprenda de los mejores

Mejores Practicas para Implementar Ambientes de Misión Critica

Con el auspicio de:

Martín Cabarique

Agenda

• Estrategia

• Opciones con Oracle 11g R2– Oracle HA infraestructure

– Snapshot Stanby Databases

– Oracle Performance Analyzer

– Oracle Database Reply

– Oracle Active Dataguard

– Oracle Real Application Clusters

– Oracle RAC One Node

– Oracle Recovery Advisor

• Servicios Disponibles

• Conclusiones & Cierre

Estrategia

Siete factores clave para implementar ambientes

de misión crítica:

• Analisis de riesgo e impacto al negocio

• No hable mas de su estrategia como un

programa de IT o bajo objetivos de IT.

• Su plan de continuidad debe estar integrado a

los procesos del negocio

• Enfoquese hacia la continuidad de los procesos

Estrategia (Cont.)

• Haga un plan a tres años que muestre los

avances en el tiempo, por ejemplo, reduciendo

riesgos, acelerando el tiempo de recuperacion,

reduciendo la taza de errores, etc.

• Asegure que su estrategia no dependa de unas

pocas personas entrenadas.

• Haga pruebas periodicas

Referencia: Linda Tucci, Senior News Writer - SearchCIO.com

Oracle HA Infraestructure

Administración automática de la infraestructura de

la base de datos.

Incluido en todas las versiones

Pequeño Clusterware para un solo servidor

Comandos similares a RAC

Srvctl start asm

Srvctl start listener

Srvctl start database -d rp

Recuperación inmediata de fallas del Listener,

ASM y Base de Datos.

Administre su Ambiente de Pruebas

Usando Snapshot Standby Databases

Physical standby database

Perform testing

Snapshot standby database

Open

database

Back out

changes

SQL> ALTER DATABASE CONVERT TO SNAPSHOT STANDBY;

Redo

stream

Redo

stream

SQL Performance Analyzer

SQL Performance Analyzer es util en casos como los siguientes:

– Database upgrades

– Implementation of tuning recommendations

– Schema changes

– Statistics gathering

– Database parameter changes

– OS and hardware changes

SQL Performance Analyzer:

Como usarle

– Capture la Carga en Producción

– Traslade la Carga a un ambiente de pruebas

– Obtenga estadísticas iniciales de desempeño

– Haga los cambios previstos

– Obtenga las estadísticas de desempeño

posteriores a los cambios

– Compare los dos resultados

– Afine los SQL desfavorecidos por los

cambios

SQL Performance Analyzer:

Reporte de Comparación

Para que usar Oracle

Database Reply

• La mayor parte de fallas en el servicio se debe a cambios en los sistemas (software y hardware)

• Necesidad de identificar el impacto de los cambios antes de hacerlos

en producción

• Las pruebas exhaustivas son muy costosas y el éxito de las mismas

bajo

– Muchas fallas no son detectadas

– Cambios pueden afectar el desempeño y disponibilidad de las Aplicaciones

• Causa del bajo éxito de las prueba:

– Imposible hacer pruebas de carga reales dejando muchos fallas sin

detectar.

• Database Replay hace posible hacer pruebas realesCopyright © 2007, Oracle. All rights reserved.

Vista Global de RAT

Production

databaseDatabase

backup

Capture directory

Shadow capture file

Shadow capture file

Shadow capture file

Shadow capture file

Pro

ce

ss

ca

ptu

re f

ile

s

Database

restore

Prechange production system Postchange test system

Replay

system

Can use Snapshot Standby as test system

Test

system

with

changes

Production

system

Clients/app servers

Copyright © 2007, Oracle. All rights reserved.

Capturando la carga con

Enterprise Manager

Copyright © 2007, Oracle. All rights reserved.

Preprocesar la Carga antes

de hacer las pruebas

Copyright © 2007, Oracle. All rights reserved.

Copyright © 2007, Oracle. All rights reserved.

Repitiendo la carga en

ambiente de pruebas

Que es ?

Oracle DataguardProducción

Redo Shipping

Movimiento Automático

Standby

Físico

Centro de Respaldo

• Solución para Protección ante desastres

• Mantenimiento de Standby Fisico en forma automática

• Switchover y Failover

• Compresion en la red

• Soportado en Versiones Standard y Standard Edition One

• Recuperación de los servicios en

menos de 10 minutos

• Protege su activo mas valioso: la

información.

• Eficiente uso de la red (compresión)

• Activo/Pasivo

• Excelente relación costo/beneficio

• Transparente a las aplicaciones

One click Switchover andFailover

Que es Oracle Dataguard?

Oracle DataguardProducción

Redo Shipping

Movimiento Automático

Standby

Físico

o

Lógico

Centro de Respaldo

• Solución para Protección ante desastres

• Mantenimiento de Standby Fisico o Lógico en forma automática

• Switchover y Failover

• Compresion en la red

Active Dataguard

• Anteriormente la Base Standby podia estar en

dos modos mutuamente excluyentes:

– Modo de Recuperacion: se estan aplicando los

cambios

– Modo de Solo Lectura

• Active Dataguard en 11g

– Permite mantener la BD standby abierta para lecturas

al tiempo que se aplican los cambios sobre la BD

Que es Oracle Real

Application Clusters RAC?

– Multiples instancias

accediendo a la misma

Base de Datos

– Instancias repartidas

entre los servidores

– Acceso Físico a cada

uno de los archivos de

la BD

– Software controla en el

acceso a los datos

Instances run on each node

Database

files

Interconnect

Copyright © 2007, Oracle. All rights reserved.

Porque usar RAC?

– Alta Disponibilidad: Servicio se mantiene

durante caidas del servidor o de instancias

– Escalabilidad sin Limites: Adicione mas nodos

cuando los necesite

– Pay as you grow: Pay for just what you need

today

– Beneficios mas importantes de Grid Computing:

• Crezca o Redistribuya bajo demanda

• Un solo boton para adicionar o remover servidores

• Distribución automática de la carga y recursos

• Founded in March 1994

• Part of Mobilcom Austria Group

• Telecom leader in Bulgaria

• First production implementation on Oracle 11g GRID

• Best Exadata v1 Performance Results

• First successful Exadata v1 custom installation

• First Customer to run OLTP on Exadata v1

Case Study: M-Tel

Referencia: NEW: Oracle Real Application Clusters (RAC) and Oracle Clusterware 11g Release 2 Por:Philip Newlan, Oracle RAC Pack

M-Tel’s vs. DB Admins’ Challenges

• Provide highest quality of service– Make every application

• highly available

• scalable

• dynamically manage application workload

• Be more flexible– Online maintenance

– Service relocation

• Do more with less– Consolidate, simplify, automate

Referencia: NEW: Oracle Real Application Clusters (RAC) and Oracle Clusterware 11g Release 2 Por:Philip Newlan, Oracle RAC Pack

Problemas para adoptar

RAC• Unable to load balance between databases

on the same node

• Most applications cannot share the same database (they aren't 100% isolated)

• Some applications aren’t certified with RAC

• No unified approach for single instance database failover. Difficult database movement between servers

• No automatic actions in the event of node failure

Referencia: NEW: Oracle Real Application Clusters (RAC) and Oracle Clusterware 11g Release 2 Por:Philip Newlan, Oracle RAC Pack

• Omotion DB-A from Node 1 to Node 8

• Failover DB-B from Node 2 to Node 9

• Rolling Patches DB-C Node 3 and Node 2

• Online Upgrade DB-C to multi-node RAC instances

Oracle Database 11g Release 2

RAC ONE – A grid of virtualized single instance databases

Resumen — Beneficios RAC One Node:

• Better virtualization for databases– Consolidation, workload management, Better HA

– Plus, online maintenance, and DB failover

• Better cluster failover– Additional value (online migration, online

maintenance)

– Single-vendor solution

• Ready to scale– Online upgrade to multi-node RAC

• Standardized Environment– Common toolset for both single-node and multi-

node Oracle database deployments

Data Recovery Advisor

– Rápida determinación, análisis y recuperación de

fallas

– Minimiza tiempos de parada

– Puede Implementarse con:

• Enterprise Manager

• RMAN command line

4. Choose and execute repair.

3. Advise on repair.

5. Perform proactive checks.

2. List failures by severity.

1. Assess data failures.

Oracle MinilessonAprenda de los mejores

Administración al MinutoQue hacer cuando su BD esta en emergencia?

Con el auspicio de:

Martín Cabarique

Agenda

• Introducción

• Arquitecturas recomendadas

• Planes de acción

• Herramientas Disponibles– Sitio Alterno

– Clusterización

– Recovery Manager

– Grid Control

– SQL*Plus

Introducción

Emergencia es todo imprevisto que afecta la

disponibilidad de los servicios de la Base de

Datos, como:– Crisis de desempeño

– Corrupción física de la Base de Datos

– Corrupción lógica de la información

– Aparición de Bugs

– Cambios imprevistos en comportamiento de

aplicación

– Caida de la red

– Caida de un servidor de Aplicaciones

Introducción

El procedimiento ante emergencias depende de

los siguientes factores:– Arquitectura en la que se encuentra implementada

la Base de Datos

– Plan activo de recuperación ante desastres

– Herramientas implementadas para el monitoreo y

pruebas

La velocidad y calidad del resultado es

directamente proporcional a la calidad de la

arquitectura implementada.

Arquitecturas Recomendadas

– Oracle Real Application Clusters

Instances run on each node

Databasefiles

Interconnect

Arquitecturas Recomendadas

– Oracle Active Dataguard

Arquitecturas Recomendadas

DBTwiceProduction Site

Redo Shipping

Automatic TransportPhysical Standby

Active Recovery Center

Arquitecturas Recomendadas

– Oracle Real Application Testing

Planes de Acción

– Base de Datos Caida

• Primero recupere los servicios, luego diagnostique

– Cambios a la BD de producción

• Pruebe los mismos antes de su implementación

• Mantenga copia de la versión anterior

– Crisis de Desempeño

• Mantenimiento predictivo

• Implementación Resource Manager

• Tome una imagen del estado actual de la BD

• Detecte la causa

• Si degradación general, kill de la sesion causante

• Si RAC, reubique los servicios afectados

Planes de Acción

– Corrupción física de datafiles

• Use sitio alterno

• Recupere los bloques dañados

• Use image copy de datafiles dañados

• Restaure y recupere los datafiles dañados

• Cargue los datos nuevamente de un import

– Corrupción lógica de la BD

• Flashback de las tablas, transacciones o BD

dañadas

• Recupere de sitio alterno

• Recupere de un export

Planes de Acción

– Corrupción física de Current Redolog

• Use sitio alterno.

• Recuperación incompleta de la BD con rman.

• Restauración de último export disponible.

– Corrupción de Controlfile

• Use sitio alterno.

• Si multiplexado, intente subir de uno en uno.

• Recupere controlfile de backup.

• Recree Controlfile

– Bug de la Base de Datos

• Si fallo en SQL específico, implemente SQL Patch.

• Diagnóstico con Metalink.

Sitio Alterno Administrado conOracle Dataguard

– Implemente Fast Start Failover

• Recuperación automática entre 20seg y 1min

Primary database

Fast-start failover standby database

Observer

Loss of connectivity >fast-start failover threshold

Oracle Real Application Clusters

– Evite crisis de desempeño con:

• Servicios

• Resource Manager

• Distribución de carga entre nodos

– Oracle Clusterware

• Recuperación automática de caidas de la BD

– ASM Cluster File System

• Clusterización de aplicaciones de terceros

• Versionamiento de aplicaciones

Oracle HA Infraestructure

– Incluido en todas las versiones

– Recuperación automática y en segundos de:

• Base de Datos Caida

• Falla del ASM

• Listener Caido

Oracle Recovery ManagerRMAN

– Integrado con Oracle Active Dataguard

• Recuperación automática y transparente a usuarios

de bloques corruptos

– Diagnóstico de fallas en la Base de Datos

– Generador de soluciones ante fallas

– Integrado con Librería de Cintas

• Elimina participación humana en recuperación desde

cintas

– Integrado con Oracle Express Backup, incluido en todas las

versiones

Oracle Enterprise ManagerGrid Control

– Incluido en todas las versiones

– Con Tuning y Diagnostic Pack se tiene:

• Generación proactiva de alertas de BD y Servidor

• Afinamiento proactivo de la instancia

• Almacena historia de las sesiones consumidoras de

recursos y generadoras de contención

• Afinamiento automático de sentencias SQL

• Facilita el diagnóstico en escenarios de ―congelación‖ de

la BD a través del monitoreo directo del SGA

Oracle SQL*Plus

– Cuando las herramientas gráficas no están disponibles, esta

es su salvación

– Documente sus scripts de diagnóstico

– Explore en la Web, hay muchos ya hechos

– Agrúpelos por temas

• Bloqueos entre usuarios

• SQLs consumidores de recursos

• Sesiones consumidoras de recursos

• etc

En resumen

• Sea proactivo

• El resultado es tan bueno como la arquitectura y las medidas

de alerta temprana

• Entrenese, el conocimiento es indispensable para los primeros

auxilios y el mantenimiento de buenos niveles de servicios

• Mantenga un soporte de calidad para atención predictiva y las

eventualidades que puedan presentarse

Estamos Para Servirlos y Queremos Servirlos Bien!

• Consultoría especializada y experimentada en asegurar la

continuidad de su negocio.

– Real Application Clusters.

– Oracle Dataguard.

– dbTwice.

• Asistencia antes, durante y posterior a la implementación de

ambiente para Recuperación ante Desastres.

• Mantenimiento Predictivo y Correctivo.

• Transferencia de conocimiento.

• Centro de soporte 24x7.

Para mayor información por favor contáctenos:

Ricardo Cárdenas

[email protected]

Germán López

[email protected]

T: +51 1 6401000