MIRACLE LINUXで構築する高信頼性MIRACLE LINUXで構築する高信頼性データベース ソリューション
―「Oracle Real Application Clusters & CLUSTERPRO」のご紹介―
2007年 5月25日2007年 5月25日
ミラクル・リナックス株式会社
カスタマ サ ビス部 鈴木庸陛カスタマーサービス部 鈴木庸陛
Agenda
MIRACLE CLUSTERPROの概要MIRACLE CLUSTERPROの概要
Real Application Clusters と CLUSTERPRO
MIRACLE CLUSTERPRO SSSソリ シ ンMIRACLE CLUSTERPRO SSSソリューション
2Copyright © 2000-2007 MIRACLE LINUX CORPORATION All rights reserved
概要MIRACLE CLUSTERPROの概要
MIRACLE CLUSTERPRO
CLUSTERPRO for Linux Ver3.1(x86-64)
NECのLinux HAクラスタ・ソフト
MIRACLE LINUX V3.0/V4.0 (x86-64)
Oracle DBとの親和性の高いLinux OS
MIRACLE CLUSTERPRO - Asianux Inside
クラ
パッラスタ
ッケージ製
「CLUSTERPRO for Linux Ver3.1」
2CPU・ライセンスNEC
製品
「MIRACLE LINUX V4.0/V3.0 (x86-64)」
2ノード・ライセンス
4Copyright © 2000-2007 MIRACLE LINUX CORPORATION All rights reserved
CLUSTERPRO概要
現用系ノードと待機系ノード間のデータ共有の方法の違いによって3タイプ
比較項目比較項目 CLUSTERPRO SE CLUSTERPRO LE CLUSTERPRO SSS
デ タ共有方デ タ共有方 スト高 共有デ スク必須 スト安 共有デ スク不要 コスト安 共有ディス
違いによって3タイプ
データ共有方データ共有方法法
コスト高:共有ディスク必須 コスト安:共有ディスク不要 コスト安:共有ディスク不要、サーバ1台
IOIOパフォーマパフォーマンスンス
SCSI, FiberChannelによる共有デ ク のアクセ
ディスクミラーリングのオー
バ ド
ローカルディスクへ
のアクセンスンス 有ディスクへのアクセス バーヘッド のアクセス
推奨データ量推奨データ量 制限なし ~100GBまでを推奨 制限なし
ノード数ノード数 2~32台:中~大規模クラスタ 2台:中~小規模クラスタ 1台:小規模ノ ド数ノ ド数 2~32台:中~大規模クラスタ 2台:中~小規模クラスタ 1台:小規模
構成概念図構成概念図
5Copyright © 2000-2007 MIRACLE LINUX CORPORATION All rights reserved
MIRACLE CLUSTERPROのメリット
OracleDBと親和性の高いMIRACLE CLUSTERPROシステムを日本国内でしっかりサポート
HAHAシステムサポートを国内ですべて完結システムサポートを国内ですべて完結
ムを日本国内でしっかりサポ ト
OSOS~クラスタ~~クラスタ~OracleOracleをオンストップサポートをオンストップサポート
国産ソフト故にNEC、MLが日本国内で柔軟・迅速にサポート可能
OSOS クラスタクラスタ OracleOracleをオンストップサポ トをオンストップサポ トOS, CLUSTERPRO, Oracleに関する問題の切り分けを弊社が対応
O lO l 向けに ン ンスした グ収集機能向けに ン ンスした グ収集機能OracleOracle向けにエンハンスしたログ収集機能向けにエンハンスしたログ収集機能CLUSTERPROログ収集機能でOracleログからOSログまで収集可能
LinuxHALinuxHAソフトで実績ソフトで実績No.1No.1システム数、ノード数、売上金額の全てで CLUSTERPRO は No.1
6Copyright © 2000-2007 MIRACLE LINUX CORPORATION All rights reserved
Oracle/Miracle/CLUSTERPROワンストップサポート
OSとOracle、クラスタのサポートをワンストップで提供し、障害を切り分け クリティカルな障害に迅速に対応可能障害を切り分け、クリティカルな障害に迅速に対応可能
フィ ドバック
問合せKernelパッチ提供
障害発生解決
定例会議
開発チーム開発チーム
フィードバック
[障害 検証 テスト]
障害切分
ッチ提供
OracleOracle China China Development CenterDevelopment Center
定例会議 [障害、検証、テスト]
NEC
障害切分
K l部分まで調査
Oracle Linux CLUSTERPROエスカレーション
Development CenterDevelopment Center技術支援
OracleOracle CorporationCorporation定例会議
Kernel部分まで調査エスカレーション
プロの技術者集団
Linux, Oracle, クラスタソフト、セキュリティ
バックエンドサポートUnbreakable Linux
協力(ML常駐)Oracle JapanOracle Japan
7Copyright © 2000-2007 MIRACLE LINUX CORPORATION All rights reserved
バックエンドサポ ト
迅速な対応、ダンプ解析、修正パッチ提供ORACLE
Real Application Clusters とReal Application Clusters とCLUSTERPRO
CLUSTERPROとRACの機能概要
<Real Application Cluster>
専 ク タ グOracle DB専用のクラスタリング
障害発生時に、他ノードで稼動中のDB(インスタンス*)に切り替え DBの停止時間を最小限に抑えるり替え、DBの停止時間を最小限に抑える
全ノードでDB(インスタンス)を稼動させ、負荷分散によるスループットの向上が可能ッ 能
<CLUSTERPRO:HAクラスタ>
システムに含まれる様々なアプリケーションのクラスタリング
障害発生時に、待機系ノードにフェイルオーバーし、システムの停止時間を最小限に抑えるムの停止時間を最小限に抑える
OS障害監視の機能が充実しており、ブラウザから監視可能
9Copyright © 2000-2005 MIRACLE LINUX CORPORATION All rights reserved
Oracle DBに限定したクラスタ・ソフトの機能比較
Active Active 現用系待機系フェイルオーバー
DB DBOracle10g RAC 10gDB
CLUSTERPRO SE
高可用性とハイパフォーマンスを兼ね備える 片ノードが待機系となるため リソースの利用効
共有ディスク(SAN) 共有ディスク(DAS)
高可用性とハイパフォ マンスを兼ね備える
約10秒前後で高速なフェイルオーバーが可能
拡張性に優れ、スケールアウトにより処理能力を拡張する
片ノードが待機系となるため、リソースの利用効率が悪い
ファイルオーバー時に、待機ノードでDBを起動する時間を要する
HAクラスタに比べ、複雑、高価
⇒ DBサーバのダウンタイムを最小限抑え、将来的な拡張性を考慮するお客様
拡張性は、基本的にスケールアップに限られる
Oracle RAC に比べ、シンプル、安価
⇒ 初期コストを抑え、DBサーバの可用性向上を検討されるお客様
10Copyright © 2000-2007 MIRACLE LINUX CORPORATION All rights reserved
上を検討されるお客様
Oracle RAC 構成案
Oracle RAC 構成案①柔軟拡張性版Oracle RAC
参考構成定価:
約¥4000万•HP ProLaint DL380G5•MSA1000マルチパス•Oracle EE / RAC (4CPU)
ターゲット2CPU x 2node以上のスペックが必要
Oracle10g EE RAC
Oracle EE / RAC (4CPU)
将来的な拡張が予想される
OCFS, rawデバイス / EEオプションを使用したい
Oracle10g EE RAC
Oracle RAC 構成案②廉価版Oracle RAC
参考構成定価:
約¥1500万
•HP ProLaint DL380G5•MSA1000マルチパス
ターゲット2CPU x 2nodeのスペックで要件を満たす
廉価版Oracle RAC
Oracle10g SE RAC
約¥1500万•Oracle SE (4CPU)
2CPU x 2nodeのスペックで要件を満たす
将来的な拡張が予想されない
ASMを使用したシステムの運用管理が可能
Oracle10g SE RAC
11Copyright © 2000-2005 MIRACLE LINUX CORPORATION All rights reserved
MIRACLE CLUSTERPRO構成案
CLUSTERPRO構成案①OracleDB HAクラスタ
参考構成定価:
約¥700万•HP ProLaint DL380G5•MSA500G2•Oracle SE One (2CPU)
ターゲット
DB処理能力の向上が要件ではない
ク タ要件と 性 向上が目的
Oracle10g
Oracle SE One (2CPU)
クラスタ要件として可用性の向上が目的
ダウンタイムが数分間発生することが許される
CLUSTERPRO SE
CLUSTERPRO構成案②廉価版OracleDB HAクラスタ
参考構成定価:
約¥600万•HP ProLaint DL380G5•Oracle SE One (2CPU)
ターゲット検索系中心のシステムの場合
廉価版OracleDB HAクラスタ
CLUSTERPRO LE
Oracle10g
検索系中 場合(更新処理が最大10%前後の劣化)
2ノードのHAクラスタ構成かつ、内蔵ディスクのDBボリュームで足りる
ローカルディスク
ローカルディスク
データミラー
12Copyright © 2000-2005 MIRACLE LINUX CORPORATION All rights reserved
クのDBボリュームで足りる デ タミラ
ミラクル・リナックス導入支援実績(例)
某リサーチ会社 ML3.0 CLUSTERPRO SE 3.1-2Oracle 9i R2
PowerEdge 2850 PowerVault 220S
某eコマ ス ML4 0(64) CLUSTERPRO SE 3 1 8 HP DL380G4 MSA1000某eコマース ML4.0(64) CLUSTERPRO SE 3.1-8Oracle 10g R2(64)
HP DL380G4 MSA1000(FC2重化)
某鉄道会社 ML4.0(64) CLUSTERPRO SE 3.1-8Oracle 10g R2(64)
HP DL380G4 MSA500G2Oracle 10g R2(64)
某製造工場 ML4.0 CLUSTERPRO SE 3.1-10Oracle 10g R2
PowerEdge 2850 Dell EMC CX600
某携帯電話コンテ ML4 0 CLUSTERPRO SE 3 1 4 HP DL380G4 MSA500某携帯電話コンテンツサービス
ML4.0 CLUSTERPRO SE 3.1-4Oracle 10g R1
HP DL380G4 MSA500
ディアゴスティーニ様
ML3.0(64) Oracle 10g R1 SE RAC(64) HP DL380G4( )
MSA1000様 (mem:16GB)
某eコマース ML3.0(64) Oracle 10g R1 SE RAC(64) HP DL380G4(mem:4GB)
MSA1000
某保険会社 ML4.0(64) Oracle 10g R2 EE RAC(64) HP DL580G2 (mem:14GB)
MSA1000(FC2重化)
某製造工場 ML4 0(64) Oracle 10g R2 EE RAC(64) SunFire X2100 Dell EMC CX700
13Copyright © 2000-2007 MIRACLE LINUX CORPORATION All rights reserved
某製造工場 ML4.0(64) Oracle 10g R2 EE RAC(64) SunFire X2100 Dell EMC CX700
監視機能: CLUSTERPRO / Oracle10g RAC
アプリケーション・レイヤーアプリケーション・レイヤーOracleインスタンス インスタンス監視 自己監視
TNSリスナー CRS
Oracleインスタンス
リスナー監視
自己監視
インスタンス監視リスナー監視
自己監視
CSSCLUSTERPRO
+DB監視オプション
自己監視
OSOSレイヤーレイヤー
ハートビート
OS監視ネットワーク監視
ハートビート
OS監視
ネットワーク監視
HWHWレイヤーレイヤーNICNICHBAHBA NICNIC
ロ カルデ スク監視
routerrouter
ローカルディスク監視
共有ディスク監視
14Copyright 2000-2005 MIRACLE LINUX CORPORATION All rights reserved
共有ディスク監視
監視機能: CLUSTERPRO / Oracle10g RAC
アプリケーション・レイヤーアプリケーション・レイヤーインスタンスのプロセス死活:1秒
プ 活 秒
CRSOracleインスタンス
インスタンスのストール:約15分 プロセスの死活:1秒
プロセスの死活:1秒TNSリスナー CSS
プロセスの死活:1秒(サーバ再起動)
リスナーのプロセス死活:~10分リスナーのストール:約15分
OSOSレイヤーレイヤー
ハートビートI/Oエラー:45秒
OSストール:hangcheck-timer
GWへのPing:1分
ハートビート:1秒OSの一部ストール:?
HWHWレイヤーレイヤーNICNICHBAHBA NICNIC
I/Oエラー:45秒I/Oストール:約15分
hangcheck timer
routerrouter
15Copyright 2000-2005 MIRACLE LINUX CORPORATION All rights reserved
監視機能: CLUSTERPRO / Oracle10g RAC
アプリケーション・レイヤーアプリケーション・レイヤー
インスタンス
CLUSTERPRO
TNSリスナー+DB監視オプション
Oracleインスタンス
プロセスの死活:即時
CLUSTERPRO+DB監視オプション
リスナーのストール、プロセス死活:約2分インスタンスのストール、プロセス死活:約2分
OSOSレイヤーレイヤー
OSストール:S ftd /IPMI
NIC Link Up/Down:数十秒
ネットワーク機器へ
HWHWレイヤーレイヤー
Softdog/IPMI
NICNICローカルディスクの
HBAHBA NICNIC
のPing:数十秒
routerrouter
I/Oストール、I/Oエラー:約2分
共有ディスクのI/Oストール、I/Oエラー:約2分
16Copyright 2000-2005 MIRACLE LINUX CORPORATION All rights reserved
MIRACLE CLUSTERPRO SSSMIRACLE CLUSTERPRO SSSソリューション
CLUSTERPRO SSSによる可用性向上
シングルサーバのシステムダウンの約70%は業務 開 能
クラスタ市場新規導入の3%
CLUSTERPRO SSSで業務再開可能FT市場
新規既存を含めた全体の
新規導入の2%
Linux、Windows障害件数230件のうち救済可能件数162件(NEC PPサポート調べ)
10%
障害件数 救済可能件数 救済率
HW障害 76 43 58%
( ポ 調 )
新規導入市場
SW障害 98 86 86%
人為ミス 56 33 58%
合計 230 162 70%
ハードウェア
伝送障害
災害その他
参考:システムダウン要因
合計 230 162 70%
クラスタでないと救えない障害 の割合は残り30%
(*)HW障害、SW障害、人為ミスの割合はGartnerの割合とほぼ一致。)
ソフトウェア人為的ミス
伝送障害
(Gartner/Dataquest, Dec1999,Causes of Unplanned Downtime)
18Copyright © 2000-2005 MIRACLE LINUX CORPORATION All rights reserved
Causes of Unplanned Downtime)
CLUSTERPRO SSSによる可用性向上
可用
S/W 単体サーバや単体サーバやFTFTサーバの可用性を向上サーバの可用性を向上<単体サーバのウィークポイント>・DISKへのアクセスが数分間戻ってこない用
性(ダウン
IA FT クラスタ
フェイルオーバー 再起動 ダウ
・DISKへのアクセスが数分間戻ってこない。・OSがストールする。・AP(Oracleなど)へのアクセスが数分間戻ってこない。・AP(Oracleなど)が異常終了。
DBDBDB
ンタイム)
フェイルオーバーのダウンタイム発
生
再起動のダウンタイム発生
DB
SSS CLUSTERPRO SSS
DBDB ・ディスク監視・OS監視
SingleServerSafeSingleServerSafe
DB・OS監視・AP(OracleDBなど)の監視・サービス監視
ダ
19Copyright © 2000-2005 MIRACLE LINUX CORPORATION All rights reserved
可用性(ダウンタイム) H/W*SSS:CLUSTERPRO SingleServerSafe
CLUSTERPRO SSS概要
シングルサーバにおいてHWやSWの監視を行い、障害発生時には、システム復旧を行うことにより可用性を向上
監視機能(実際に監視対象へアクセスすることにより、エラーログが記録されてない場合でも障害検出が可能)
HW監視(NIC監視 ディスク監視)HW監視(NIC監視、ディスク監視)
SW監視(OS監視、サービス/プロセス監視、ユーザアプリケーション監視)
復旧機能
サーバの再起動、SWの再起動
SSSがOSのスト ルを検出
SSSがOSを再起動 SSSがAPの異常を検出
SSSがAPを再起動する とにより復旧OSのストールを検出 することにより復旧 APの異常を検出 することにより復旧
SSS SSS SSS SSS
DB DB
20Copyright © 2000-2005 MIRACLE LINUX CORPORATION All rights reserved
CLUSTERPRO SSS適用システム例①
エッジサーバからAll in Oneサーバまで簡単、安価にサ ビスの可用性を向上
障害検知時にサービス自動復帰
サービスの可用性を向上
GUIツールよる状況確認と障害発生時のメール通報
例えばAll in One のWebDBサービス監視を実施
<主な監視項目>
アプリケ ション
WebDBサービス監視
Apacheアプリケーション
OS
ディスクデバイスTomcat
Apache
PostgreSQL
CLUSTERPRO SSS
NIC
IPアドレス
21Copyright © 2000-2007 MIRACLE LINUX CORPORATION All rights reserved
CLUSTERPRO SSS
CLUSTERPRO SSS適用システム例②
CLUSTERPRO SSSによるWeb/APサービスの監視
AP監視オプションを使用し、単なるPort監視ではなく、実サー視 使 、 視 、実ビスと同様の処理を実施し、AP監視を実施
障害検知時にはAPの再起動、またはサーバの停止/再起動を実施する とで対応を実施することで対応
Load Balancer
CLUSTERPRO SSS
Web / AP
CLUSTERPRO SSS
Web / AP
CLUSTERPRO SSS
Web / AP
再起動
22Copyright © 2000-2007 MIRACLE LINUX CORPORATION All rights reserved
CLUSTERPRO SSS適用システム例③
MIRACLE CLUSTERPRO X(2007/7出荷予定)より統合管理が可能
複数のクラスタの複数のクラスタの L3スイッチ
統合管理が可能
複数のクラスタの参照・管理が可能複数のクラスタの参照・管理が可能 Load Balancer
WebLogic WebLogic WebLogic
CLUSTERPO SSS CLUSTERPO SSSCLUSTERPO SSS
CLUSTERPRO SE
Oracle
23Copyright © 2000-2007 MIRACLE LINUX CORPORATION All rights reserved
CLUSTERPRO SSS構成事例
アシスト・WebFOCUS WingARC・RDEアシスト・NOREN
Tomcat
Webfocus
Tomcat
RDE
Tomcat
NOREN
Oracle10g
CLUSTERPRO SSS
PostgreSQL
CLUSTERPRO SSS
Oracle10g
CLUSTERPRO SSS
某自治体業務パッケージ②
LB
某自治体業務パッケージ①
LB LB
WL WL WL WL WL WL WL WL
LB
ML40ML40ML40ML40Websphere Websphere WebsphereWebsphereSSS SSS SSS SSS WL WL WL WL WL WL WL WL
Oracle 10g RAC
SSS SSS SSS SSS SSS SSS SSS SSSML40ML40ML40ML40
Oracle10g
SSS SSS SSS SSS
24Copyright © 2000-2007 MIRACLE LINUX CORPORATION All rights reserved
Oracle 10g RACCLUSTERPRO SE
g