Upload
cloudian
View
8.506
Download
3
Embed Size (px)
DESCRIPTION
オフィスツールの高性能化とモバイル化、ビッグデータ分析、DR(災害復旧対策)。特に最近では、これらの要因がデータ量を急増させ、多くの企業を悩ませています。クラウドのIT 技術は、この課題を低予算に解決します。本ホワイトペーパーでは、クラウドのストレージ基盤に活用される「オブジェクトストレージ」の概要と、国内外で豊富な商用採用実績をもつソフトウェアベースのオブジェクトストレージ製品「Cloudian(クラウディアン)」について紹介します。
Citation preview
オフィスツールの高性能化とモバイル化、ビッグデータ分析、DR(災害復旧対策)。特に最近では、これらの要因がデータ量を急増させ、多くの企業を悩ませています。クラウドの IT 技術は、この課題を低予算に解決します。本ホワイトペーパーでは、クラウドのストレージ基盤に活用される「オブジェクトストレージ」の概要と、国内外で豊富な商用採用実績をもつソフトウェアベースのオブジェクトストレージ製品「Cloudian(クラウディアン)」について紹介します。
企業が活用するオブジェクトストレージ入門急増するデータの悩み、クラウドの IT 技術で低予算に解決
企業が抱える急増するデータの悩み、3 つの要因
急増しているのは「非構造化データ」
大量の「非構造化データ」を扱うのがクラウド
には、たとえば今後 10 年間分といったデータを保存する必要性が生じています。分析スピードがビジネスの差別化につながるとも言われ、リアルタイムに分析できることがますます重要になり、これまでテープで倉庫に保管してきたようなデータもオンライン活用できる対応が求められています。
(3)DR(災害復旧対策)に対する意識の高まり東日本大震災以降、複数箇所にデータを保管する重要性が強く認識されました。一箇所だけでは事業継続性の観点からリスクが高いという経験を経て、複数地域のデータセンターにデータを複製しておくことが求められています。これを単純に考えれば保管するデータ量が倍になるということです。
これらの要因により、企業の IT 部門はひっ迫するストレージ容量、増え続けるファイル数、長期化するデータ保管期間への対応、データ量増加に伴うシステムの性能劣化等に対処しなければなりません。これは、ストレージ装置の増設・置換、データ移行作業や、バックアップ、アーカイブといったデータ管理コストの増大につながります。データ量が増えれば IT 予算も増えるという時代ではありません。従来の延長線にある仕組みとは異なる、新たな低コストの解決策が求められています。
音楽、ログなど多種多様です。これらの多くが書き換えや更新の頻度が少ない、若しくは更新されることが無いデータです。写真が良い例でしょう。デジタルカメラやカメラ内蔵スマートフォンで多くの人が膨大な数の写真を撮りますが、一旦撮影し保存した写真が更新されることはありません。新しい写真が次々と追加されるだけです。
企業活動においてデータが増え続けることから生じる悩みは尽きることがありません。最近では、次の3つの要因がデータを急増させていると言えるでしょう。
(1)オフィスツールの高性能化とモバイル化各種オフィスツールが高性能化し、私たちが日常見かけるオフィス資料には、いわゆる「ファイルサイズが重い」写真や画像が当たり前に使われるようになりました。また、タブレットやスマートフォンの普及により、移動時間や出張先での作業も可能になり、作成資料の数や、そのファイルをメールでやり取りする機会が増えているのではないでしょうか。これを裏付けるように、多くの専門アナリストが年率 50%以上でデータ量が増加していると述べています。
(2)ビッグデータ分析に対する認知度の向上Hadoop を始めとするビッグデータ処理ツールが身近になり、またビッグデータが生み出す新たな価値が理解されるにつれ、ビッグデータ分析が注目を集めています。それに伴い、相関分析のために従来は活用されていなかったようなデータも大量に保存されはじめています。さらにライフサイクルにそった経年変化の分析
これらの課題解決にあたり着目するべきは、いま急増しているデータは、「非構造化データ」であるという点です。
この「非構造化データ」とは、一般的なリレーショナルデータベースで扱うデータとは異なり、あらかじめデータの構造が定められていないデータです。それは、オフィス文書、写真、動画、画像、
この「非構造化データ」を大量に扱っているのがクラウドです。
たとえば、インターネットサービスの SNS は、何十万人、何百万人という利用者が、文字情報を交換し、写真を共有し、動画や音楽をアップロードしています。利用者がストレスを感じないよう、速く処理することも求められます。格安であったり無償の
広告モデルで提供されているサービスも多く、サービス運営は低コストであることが絶対条件となっています。
Google や Amazon といった本物のクラウドでは、多種多様で膨大なデータを迅速に低コストで処理する IT 技術が活用されています。これを、本ホワイトペーパーでは「クラウドスケールIT」と呼ぶこととします。
1
一般的にクラウドでは、高価なストレージ装置を使うのではなく、数十万円といった安価な汎用サーバーをハードウェアとし、それを、数百台、数千台並べ、分散処理ソフトウェアで統合制御しています。これにより高い「経済性」を実現しています。
安価なハードウェアの場合、故障する確率が高いとも言われています。故障により、保存しているデータが消失しては困ります。こういった事態を防ぐため、複数のサーバーにデータの複製をつくることや、データを分割して配置することでシステム全体としての「信頼性」を高めています。
ひとつのサーバーが故障したことでシステム全体が停止してしまうことも困ります。いつでも利用できる「可用性」を維持する仕組みや、故障したサーバーを取り換えさえすれば、自動的にシステムの一部として機能しはじめる「弾力性」を備えていることが一般的です。
クラウドのような環境では、データがどのように増加するかを、あらかじめ予測することは困難です。ある日突然、サービスが人気を集め、大量のデータが押し寄せるということが起きます。そのため、「データが一杯になったら高性能・大容量の装置に取り換える」では間に合わず、「新しい装置を追加する」ことで、システム全体の容量を増やすことができる「拡張性」が重要です。このような仕組みは、スケールアウトと呼ばれています。
「クラウドスケール IT」で活用されるストレージ基盤がオブジェクトストレージ
クラウド環境における階層構造の課題とは
【図 1】クラウドスケール IT
この「クラウドスケール IT」のストレージ基盤として活用されているのがオブジェクトストレージです。
オブジェクトストレージは、Amazon では「Amazon S3」、ニフティでは「ニフティクラウドストレージ」、NTT コミュニケーションズでは「Biz ホスティング クラウド・エヌ オブジェクトストレージ」といったクラウドストレージサービスとして提供されています。また、写真等のオンラインストレージサービスを提供する NTT 東日本の「フレッツ・あずけ~る」のような、最
私たちが日常使うファイルシステムは、図 2 の左側に示すようにディレクトリやフォルダーといった階層があります。この構造は、ある意味、人間の直感に合っています。つまり、地球があり、日
近では「Web スケール」とも呼ばれる大規模なインターネットサービスでもオブジェクトストレージが活用されています。
このオブジェクトストレージでは、オフィス文章、写真、動画等のファイルを「オブジェクト」と呼びます。そして、これらのオブジェクト間の関係がフラットであり、階層構造がないという特長があります。この構造ゆえに、クラウドで求められる可用性や拡張性といった要件が実現できます。
本があり、東京があり、渋谷があるという流れで目的地に到達できるため、たいへんにわかりやすいと言えるでしょう。
【図 2】ファイル構造とオブジェクト構造
分散処理ソフトウェアが多数のノードを統合制御
信頼性
経済性
可用性
広域網
拡張性
データを複製
ノード追加で容量拡張
データセンター1 データセンター2
VolumaA/MyFolder/Favorite/Music http://s3.cloudian.com/abc123def4....
VolumaB/John/Music
フラットにファイルを格納
ファイル構造 オブジェクト構造
2
しかし、この構造の場合、ファイル数が増え、それを格納する物理的なハードウェアの容量が一杯になると困ったことが起こります。たとえば、別のハードウェアにファイルを移し替えるとなると、ファイルのありかを示す情報が完全に変わってしまいます。東京から埼玉に引っ越せば住所が変わってしまうことと同じです。そのたびに、住所変更のお知らせをしなければなりません。クラウドのような環境では、何万人という利用者が使い、急激に
データ量が増えるといったことが当たり前におこります。その一方で、データをストレージする物理的なハードウェアの容量には制限があります。容量が一杯になるたびに、利用者に住所変更のお知らせをすることは運用者にとって大きな手間がかかります。利用者にとっても、ある日、ファイルの格納場所がわからなくなり、アクセスできないといったことも起きてしまうかもしれません。
フラットな構造のオブジェクトストレージ
属性情報(メタデータ)の役割
オブジェクトストレージでデータ急増の悩みを解決
オブジェクトストレージは、図 2 の右側に示すように階層構造がありません。オブジェクト毎に ID(識別子)が与えられますが、このIDには「東京」といった場所情報が含まれていません。つまり、データがどのハードウェアに格納されていても、どこに引っ越しをしても ID は同じということです。
ファイル構造を住所情報が必要な手紙にたとえるならば、オブジェクト構造は電子メールのようなものです。たとえば、東京から埼玉に引っ越しすると、住所情報を含む手紙の場合には宛先不明になるかもしれません。電子メールであれば住所変更しても、なんら影響なくメールが届きます。
オブジェクトストレージのもうひとつの大きな特長に、オブジェクト毎にデータを効率的に管理するための属性情報(メタデータ)をカスタマイズして付けることができるという点があります。
オブジェクトに属性情報を付けることで、一定期間経過後、オブジェクトを消去したり、アクセスできる利用者を制限するといったことができます。属性情報の活用例のひとつとして、図 3 にCloudian の自動階層化機能のスクリーンショットを紹介しています。これは Cloudian に格納したオブジェクトを一定期間経過後、Amazon S3 や超低価格のアーカイブサービス Amazon Glacier に移動するという機能です。オブジェクトに属性情報を付与することで実現しています。
現在、一般的に企業 IT で活用されているストレージは、SAN と呼ばれるブロックストレージ、NAS と呼ばれるファイルストレージです。これらのストレージは、処理性能が高く、迅速な更新処理が求められるデータベースのデータ等を格納するために活用されています。ただし、これらのストレージは企業構内において近距離の高速なネットワークで接続されることを前提としています。インターネット経由や、多地点の複数データセンター間でのデータのやり取りに適しているとは言えません。オブジェクトス
このオブジェクト ID は、一般的にインターネットで使われるURL が付与されることが多く、相手にこの URL を知らせるだけでオブジェクトを読み出すこともでき、インターネットで便利に使うことができます。
また、オブジェクト単位で複製し信頼性を高めたり、物理的なサーバーを追加するだけでシステム全体の容量を拡張したり、複数データセンター間でオブジェクトをやり取りしたりということが簡単にできるようになります。一方、クラウドのような多数のサーバーが並ぶ環境のなかで、階層構造を維持することの難しさは直感的に理解していただけると思います。
トレージは、その逆です。性能はこれらのストレージに比べ落ちますが、更新頻度の少ない「非構造化データ」をクラウドのように広域網を経由する環境でやり取りすることに適しています。
さて、いま急増しているのは「非構造化データ」であると説明しました。この「非構造化データ」のうち、更新の必要のないデータはコールドデータ、頻度の少ないデータはクールデータとも呼ばれ、データ全体の 70%を占めるとも言われています。
【図 3】Cloudian における属性情報の活用例
3
考えてみれば、これらの特徴をもつ「非構造化データ」をストレージするためには、高性能であることは必要ありません。むしろ、多種多様で膨大なデータを経済的に処理し、拡張性が高いことが求められます。つまり、「クラウドスケール IT」のオブジェクトストレージが適しているのです。
これまで、オブジェクトストレージは大量データを対象とし、コンテンツを膨大に抱えるメディア業界や政府、研究等の専門的な
領域で利用され、一般企業にとって身近な製品とは言えませんでした。そのため、SAN や NAS といった従来型のストレージ装置しか選択肢がなく、コールドデータやクールデータのストレージにも高性能の装置を使い続けてきたというのが現実です。しかし、いまや、これから紹介する Cloudian のように手軽に利用できるオブジェクトストレージ製品が登場してきました。低予算で企業が抱える急増データの課題を解決できるのです。
オブジェクトストレージの使いどころ
オブジェクトストレージの代表的なソフトウェア製品「Cloudian」
(1)オンライン活用するデータここまで説明してきたように、更新頻度が少ない、若しくは更新することが無いものの、オンラインで活用するデータは、オブジェクトストレージの使いどころです。典型的な例がバックアップデータです。企業 IT システムのデータには必ずバックアップを用意しますが、必要な際にはオンラインですぐに読み出すことが求められます。しかし、その一方で、万が一のためのバックアップにコストをかけたくないというのが企業の本音です。
また、企業にはオフィス資料、イベントやプロジェクトの記録写真、機械による画像記録、建築物・機械・装置等の設計図面、各種実験等の動画記録等々、オンライン活用が求められる膨大な数のファイルがあります。こういったデータの保管にオブジェクトストレージを活用することで IT システム全体のコスト低減につながります。
特に最近では、モバイル環境やブロードバンド環境が整ったことにより、外出先、自宅、遠隔オフィス等、広域から社内ファイルシステムにオンラインでアクセスする機会が増えています。従来のファイルシステムは広域、分散環境への対応は得意ではありません。このようなファイル共有・同期には、オブジェクトストレージが適しています。
(2)安全に大量に保管するデータコンプライアンスの要請や証拠書類として保存が義務付けられているデータ量は年々累積し増加してゆきます。これらのデータはテープに移し倉庫で長期間保管されることが一般的です。しかし、テープ保管は、いざ必要な時には保管倉庫から運搬するといった人手もかかり、すぐに読み出すことができません。テープ保管に
Cloudian は国内外の商用クラウドストレージサービスのストレージ基盤に活用されている、ソフトウェアベースのオブジェクトストレージ製品です。
汎用的な IA サーバーをハードウェアとし、OS には Linux を使います。汎用的なサーバーの価格は、年々高性能化し高集積化しながら、その値段を下げており、1 台あたり数十万円でも数十テラといった内蔵ディスクを搭載しています。このようなハードウェアを使うことで低コストのオブジェクトストレージシステムを構築することができます。
合わせてオブジェクトストレージを活用することで、これらのデータをオンラインで簡単に活用できるようになります。
特に Cloudian であれば、複数データセンターにデータ複製を行い、自動的に複数地域に分散し保管できるため、遠隔の倉庫にテープ運搬するような作業も不要です。データを安全に大量に保管しながらも必要な時にすぐ使えるアクティブなアーカイブにオブジェクトストレージは最適です。
(3)ビッグデータ分析のための大量データビッグデータ分析は、その名のとおり膨大な量のデータを分析することです。Hadoop のようなビッグデータ処理ツールが身近になったことに加え、センサーの小型化やモバイルネットワークの普及に伴い、これまで収集することが難しかった人間・装置・車等機械の移動、ビルや橋梁といった構造物の変化などのログデータまでもが分析の対象となりはじめています。
この膨大な量のデータ解析には、一時的に多数のコンピューティングリソースが必要となるため、パブリッククラウドを活用する事例も増えています。その一方で、データを外部に預けられないという事情がある企業も多く、その場合にはデータは、自社管理できる企業構内やデータセンターに保存しておくという対応も増えてきそうです。
これらのデータは 1 年で捨てられるわけではなく、経年変化をみるために貯め続けられ、将来に亘りどれだけ増えてゆくのか予測するのも難しいとも言えます。こういった大量データの保存には、拡張性高く、経済的なオブジェクトストレージが活用されることになるはずです。
【図 4】IO データ社製 NAS と Cloudian の接続例
IOデータのNAS製品HDL-XRWシリーズとCloudianの接続例
Cloudianからのアクセスキー・シークレットキーを入力し、エンドポイントをCloudianに向けるだけで接続
4
すでに企業で広く利用されています。つまり、現在企業が利用しているアプリケーションを取り換えたり、改修することなく、簡単に Cloudian にデータを格納することができるのです。
(2)クラウドサービスからエンタプライズ IT まで、広い活用範囲さらに重要な Cloudian の特長は、非常に活用範囲が広いという点です。他製品には1PB(ペタバイト)規模のデータ量からの利用を前提としている製品もありますが、Cloudian は汎用サーバー2 台規模から利用開始することができます。このように企業 IT のデータ規模からスモールスタートできる一方で、すでに多くの国内外商用クラウドストレージサービスに採用されているように、サーバー台数を追加するだけで大規模なクラウドサービスにまで拡張することができます。
統計、課金、利用者、利用量等管理機能もパッケージされており、これらの管理機能を別途開発したり調達したりという必要無しにターンキーで利用開始できるという点も強みです。サービスプロバイダーが短期間でクラウドストレージサービスを開始できることはもちろんですが、企業利用においても部門予算管理等のために、別途アプリケーションを開発する必要もありません。
(1)Amazon S3 の API に完全準拠この Cloudian の重要な特長は、クラウドストレージの事実上の標準となっている、Amazon S3 の API に完全準拠しているということです。
他製品でも S3 API を提供しているという製品はありますが、データの読み書きといった基本的な API を提供しているだけです。Cloudian は、バージョニング、マルチパートアップロードといった高度な操作ができる API までも実装しており、質量ともに準拠しているという点が大きく異なります。
特に質という点では、数多くの Amazon S3 を利用しているアプリケーションや製品との相互接続検証がされ、そのいずれもがCloudian にデータの保存先を向けるだけで簡単に接続できています。図 4 は最近発表した IO データ社製の S3 対応 NAS との接続方法です。このように、アクセスキー・シークレットキーを入力し、エンドポイントというデータの格納先を Cloudian に向けるだけで、NAS から Cloudian にデータをバックアップできます。
このような S3 対応のエンタープライズ向け製品は数多くあり、
パブリッククラウドに採用されている Cloudian
Amazon S3 の API に完全準拠する Cloudian は、ニフティやNTT コミュニケーションズ等の日本の代表的なクラウドサービスのストレージ基盤に活用されています。また、米国ではホスティングサービスやデータセンターを提供している数多くの事業者が、地域密着型のクラウドストレージサービスを提供するために採用し始めています。欧州各国では国外にデータを預けることに制約があるとのことで、Cloudian を採用したクラウドストレージサービスを国内で提供する動きが活発化しています。
この Cloudian は、クラウドコンピューティングサービス基盤を提供するソフトウェア製品、CloudStack や OpenStack とも連携しています。たとえば、CloudStack からサインオンすれば自動的に Cloudian もサインオンできるシングルサインオンや、仮想サーバーのスナップショット、イメージ、テンプレート等を保存しておくセカンダリストレージとして利用できます。つまり、CloudStack や OpenStack でクラウドコンピューティングサービスを提供しているクラウドサービスや、これから紹介するプライベートクラウドにおいても簡単にオブジェクトストレージをメニュー追加できるのです。
Cloudian をプライベートクラウドのストレージ基盤に活用
ストレージ基盤における活用についてから紹介します。Cloudian は国内外のパブリッククラウドだけではなく、図 1 に示すように幅広く活用できます。まず、プライベートクラウドの
Cloudianの適用領域
S3 Cloud Object Storage
サービスプロバイダー エンタープライズIT
パブリッククラウド プライベートクラウド
ハイブリッドクラウド
● Amazon S3と同等の クラウドストレージ サービス● クラウドコンピューティ ング基盤(CloudStack、 OpenStack)のセカン ダリ・ストレージ
● 写真等オンラインスト レージなどのストレージ 基盤● 企業内・グループ内・コ ミュニティのクラウドス トレージ基盤
大量のコールドデータを低コストで格納● データバックアップ● アーカイブ(Eメール等)● ファイル同期・共有● NAS・SANストレージの 拡張と階層化
【図 1】Cloudian の適用領域
5
(1)クラウディアンが考えるプライベートクラウド
プライベートクラウドについては、「仮想サーバー環境を企業内で作ること」のように語られるケースも多く見かけますが、それはクラウド環境の一部を語っているに過ぎません。私たちは不特定多数が利用するパブリッククラウドとまさに同じ環境を、企業内、グループ内、コミュニティ内といった特定の利用者専用に提供するクラウド環境こそがプライベートクラウドだと考えています。
それは、前編で説明したクラウドスケール IT の条件を、プライベートクラウドが満たしていることです。仮想サーバー環境があったとしても、たとえばデータを格納するストレージには拡張性がなかったり、複数データセンターにデータを分散し格納したり、複製できないような環境を、プライベートとは言えクラウド環境であると称するのは少し違うと考えているということです。設備の設置場所だけに着目して、企業構内、つまりオンプレミス
に構築することをプライベートクラウドと呼ぶ場合もあります。これも私たちの考え方とは違います。サービスプロバイダーが、そのデータセンターに特定のお客様専用に隔離したクラウド環境を作り、サービスとして提供する場合もプライベートクラウドだと考えているからです。これらは、マネージドプライベートクラウドやホステッドプライベートクラウドとも呼ばれています。
さらに、「Web スケール」と最近総称される、インターネット上で展開される大規模なサービスのストレージ基盤としての利用もプライベートクラウドに含まれると考えています。そのサービス利用者専用であり、プライベートともいえるクラウド環境だからです。特に、パブリッククラウドを利用して Web サービスを小規模にスタートし、規模が大きくなった時点でプライベートクラウドに移行してゆくといったケースが今後増えてくると考えています。
ンと Cloudian のオブジェクトストレージを組み合わせ、外部にデータを預ける必要のないプライベートクラウドを構築すれば、企業 IT 部門がデータ管理できる自社専用のファイル管理サービスを社員に提供できるのです。
パブリッククラウドを利用したクラウドサービスの場合には、官公庁や大手企業、個人情報を扱うお客様に利用いただけないとの話は、いくつものサービスプロバイダーから聞こえてきます。クラウドサービスの利便性が広く理解されるにつれ、同様の声はますます増えてくることが考えられます。このようなジレンマは、お客様の企業構内や専用データセンター内にプライベートクラウドを構築することで解決してゆくことになるでしょう。
【図 2】Fileforce のユーザーインターフェース
Amazon S3 を利用するサービス、アプリケーション、アプライアンス等は、数百種類はあると言われています。そのため、利用者にとっては、Cloudian が Amazon S3 の API に完全準拠していることで、すでに活用している S3 対応アプリケーションをそのまま利用できるというメリットがあります。アプリケーションを開発する立場からすると、S3 に対応したアプリケーション開発の経験者が多いことに加え、開発するための情報や共同開発等ができるパートナー、相互接続できる仲間が多いというメリットがあります。
また、アプリケーションを提供するクラウドサービス、SaaS(Software as a Service)のアプリケーションをプライベート環境に転用し活用できる可能性が広がります。
図 2 で紹介しているのは、クラウドサービスとして提供されているファイルマネジメントサービス「Fileforce(ファイルフォース)」のユーザーインターフェースです。
Fileforce は Dropbox のようなファイル同期・共有ができるサービスですが、不特定多数の利用者(コンシューマ)を対象とするものではありません。法人向けのサービスであり、高いセキュリティを備えています。ファイルのストレージには、Cloudian を採用するニフティ、NTT コミュニケーションズ等のパブリッククラウドを利用しています。
最近、大手企業等においては、コンプライアンス等の観点からデータを外部に預けられないといった事情があり、パブリッククラウド利用に踏み切れないというケースを聞くことが増えています。このようなお客様のニーズに対応するため、Cloudian とFileforce はプライベートクラウド環境での接続試験を実施し、相互接続性を公式認定しています。Fileforce のアプリケーショ
(2)Amazon S3 API に完全準拠する Cloudian プライベートクラウドのメリット
クラウド型ファイルマネジメントサービス「Fileforce」
エンタープライズ IT における Cloudian の活用パターン
ここまでプライベートクラウドにおける Cloudian の活用について説明してきましたが、一般の企業 IT 部門が企業構内(オンプ
レミス)のオブジェクトストレージとして Cloudian を活用するパターンを紹介したのが図 3 です。
6
【図 3】企業 IT における Cloudian の活用
以下、この図 3 を説明してゆきます。
ログのストレージ:監視カメラの映像、行動履歴、通信履歴、操作履歴、アクセス履歴等のログは膨大なデータ量になってゆきます。また、ログは書き換えたり更新されたりするものではなく、大量に貯めておく一方で、必要な際にはオンラインですぐに活用できることが求められます。こういったデータを高価で高性能なストレージ装置に保存しておく必要はありません。まさに高い拡張性と経済性を実現する Cloudian のようなオブジェクトストレージが適しています。
ビッグデータ分析データ:ビッグデータ分析に利用されるオープンソースの Hadoop MapReduce( マップリデュース ) は S3インターフェースを備えています。そのため、Hadoop 専用の分散ファイルシステムである HDFS(Hadoop Distributed File System)を使わず、Cloudian にデータを直接保存してしまうという方法があります。こうすることで、Hadoop MapReduce以外の目的にデータを使う場合にも、HDFS から他のストレージに移し替える手間や、別途ストレージを準備する必要もなくなります。つまり、ビッグデータ分析のためだけの特別なストレージ領域が不要となり、企業の IT コスト効率を高めることができます。
ファイル同期・共有:先に紹介した Fileforce のようなファイル同期・共有アプリケーションのファイルを格納するストレージに Cloudian は適しています。ファイル量が増加し、ストレージ装置の物理的な容量が一杯になり、高性能・大容量の装置に取り換えたり、そのストレージ装置の障害に備えたバックアップ用システムの心配をする必要もありません。
前編で説明したように、企業構内で利用されることを前提としている SAN や NAS といったストレージ装置とは異なり、Cloudian のようなオブジェクトストレージは、遅延が生じるモバイルやインターネットといった広域網経由でファイルにアクセスすることに適しています。オブジェクト ID が URL であれば、インターネット経由でファイルをやり取りすることも簡単に行うことができます。
バックアップ:バックアップとは、ファイルサーバーに障害等があっても重要なファイルが消失しないよう複製データを別の装置やテープに保管しておくことです。このバックアップは、企業で導入検討される際、収入増につながるものではなく、万が一のためであり、そこにかかるコストは最小限にしたいというのが本音でしょう。実際のところ、高価なストレージ装置をバックアップデータのストレージに使用するケースが多く、ミラーシンクのオプションソフト購入が必要なケースもあります。S3 対応のバックアップ用アプリケーションを使い、バックアップデータをCloudian に格納すれば、バックアップも含むシステム全体としてデータ管理コストを適正化できます。
一般的に企業では長期間のバックアップはテープに保存しています。ただし、そのテープを遠隔地の倉庫等に保管してしまえば、読み出しに手間と時間がかかってしまい、簡単には活用できない、いわゆる死蔵データとなってしまいます。そのため、テープ保管
ログ
データ
メール
ビッグデータ分析ファイル同期・共有
アーカイブ
階層化
バックアップハイブリッドクラウド
地域分散
AWSS3
Glacler
ビッグデータ分析ビッグデー
地域分散
しながらも、オンラインで利用する可能性のあるバックアップデータは Cloudian を使い、オンラインで活用できるようにしておくことが望ましいと言えます。
なお、PC データをバックアップする手軽なアプリケーションもS3 対応しています。また、IO データ社製のような小型 NAS もS3 に対応しており Cloudian に自動バックアップ可能です。
アーカイブ:アーカイブとは、データを整理し、かつ改ざんできないように長期間安全に保存しておくことです。利用例では Eメールのアーカイブが代表的です。多くの企業では各社員あたりのメールボックスサイズに制限を設け、その制限サイズになると、社員が自らローカルの PC や外付けハードディスク等にダウンロードし保管しているという話を聞きます。メールボックスはデータ量が増えてくると性能が劣化します。その一方でメールボックス拡張にはコストがかかるため、社員にサイズ制限を強いることにより対応しているのが現実です。
今後、メール数が減るとは想定しにくく、社員の手元で保管される過去のメール量は累積し増える一方でしょう。社員にこのような手間をかけさせたり、その手元に大量の過去データがあるという状況は、企業 IT 部門としても決して好ましい状況とは考えていないはずです。S3対応のアーカイブ用アプリケーションを使い、適切なタイミングで自動的に Cloudian にアーカイブしておけば、社員や企業 IT 部門の手間を軽減できるはずです。
階層化:ストレージにおける階層化とは、データの種類や利用頻度に応じて複数のストレージ装置に階層を設けることです。つまり、一定期間が経過したり、利用されることが少ないデータは、高価で高性能ストレージから比較的安価なストレージ装置に移行するといった具合に、ストレージ装置を使い分けるということです。
クラウドゲートウェイと呼ばれる、SAN や NAS 等、ストレージ専用装置に用いられるプロトコルと S3 との変換アプリケーションを使えば、ストレージ専用装置から自動的にデータをCloudian に移行することができます。また、S3 対応のストレージ階層化用アプリケーションを使えば、ストレージの階層にCloudian を加えることができます。たとえば、大量の「非構造化データ」は Cloudian に格納することで、ストレージシステム
7
まとめ
Google や Amazon といった世界を代表するクラウドは、いま企業 IT が直面しはじめた膨大な「非構造化データ」に早い時期から対処してきました。この本物のクラウドが活用する IT 技術、すなわち「クラウドスケール IT」のストレージ基盤がオブジェクトストレージです。Cloudian は、Amazon S3 API 完全準拠のソフトウェアベースのオブジェクトストレージ製品です。急増するデータの課題を解決するために、大規模クラウドからエンタープライズ IT まで幅広いシーンで活用いただけます。特に企業が
Cloudian を使えば、企業内、グループ内、コミュニティ内といった特定の利用者専用に提供する、パブリッククラウドと同じ環境のプライベートクラウドを構築運用できます。エンタープライズIT の分野においては、すでに数多くの S3 対応アプリケーションが存在しています。これらのアプリケーションと Cloudian を組み合わせて活用することで、データ急増により、企業 IT 部門が直面するさまざまなシーンにおける課題を解決できるのです。
全体としてのコスト最適化をはかることができます。
地域分散:東日本大震災以降、地域・広域分散した複数データセンターにデータを複製し安全に保管する必要性が強く認識されています。従来型のストレージ装置では、複数データセンターに対応する場合、同じ装置やシステムを 2 重に用意し、非同期、手動でデータ複製を行うことが一般的です。そのため、あるタイミングでは、複数データセンターの一方には、最新データが保存されているものの、もう一方では、そのデータが保存されていないというケースも起こります。Cloudian は複数データセンター間で、同期・非同期を選択し、データ複製を行うことができます。広域に Cloudian ノードが分散されてもネットワーク経由で複製データを経済的に分散配置しておけます。さらに、次に紹介するパブリッククラウドもデータの分散保管先としても加えることで、2重、3 重にデータを保護することができるのです。
ハイブリッドクラウド:Cloudian には、保存したデータを自動的に Amazon S3 や Amazon Glacier に移動する自動階層化
(AWS Auto Tiering)機能が備わっています。特に Amazon Glacier は超低価格であり、データを経済的にアーカイブしておくことができます。ただし、パブリッククラウドであるため、外部に預けることができないデータのアーカイブに使うことに抵抗があるというケースがあります。また、読み出しに時間がかかるため、速い処理を求めるデータの保存にも適していません。
そういったデータは、Cloudian で企業構内に構築したプライベートクラウドやオブジェクトストレージに保管し処理することが望ましいと言えます。このように、Cloudian であれば、パブリックとプライベートクラウドをデータの目的や種類に応じてハイブリッドに使い分けることも可能となります。
Cloudian は、2011 年 7 月に商用版リリース以降、国内外のクラウドサービスやエンタープライズ IT に採用されている、ソフトウェアベースのクラウド・オブジェクトストレージ製品です。Amazon S3 に完全準拠する API を備えており、数多くの S3 対応アプリケーションやツールとの接続性が検証済みです。パブリッククラウド、プライベートクラウド、ハイブリッドクラウド、エンタープライズ IT と幅広い分野のストレージ基盤として活用できます。
Web: www.cloudian.jpTwitter : www.twitter/Cloudian_KKFacebook:www.facebook.com/cloudian.cloudstorage.S3Slideshare:www.slideshare.net/geminimobile
お問い合わせ住 所:〒150‐0002 東京都渋谷区渋谷2-11-6 ラウンドクロス6階電 話:03‐6418‐6466Eメール:[email protected]
クラウディアン株式会社
8