Click here to load reader

download.microsoft.comdownload.microsoft.com/...0ED2-4C20...SearchEval.docx  · Web viewMicrosoft SharePoint Server 2010. エンタープライズ検索評価ガイド. このドキュメントは暫定版であり、このソフトウェアの最終的な製品版

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Microsoft SharePoint Server 2010

エンタープライズ検索評価ガイド

このドキュメントは暫定版であり、このソフトウェアの最終的な製品版の発売時に実質的に変更されることがあります。

このドキュメントに記載されている情報は、このドキュメントの発行時点におけるマイクロソフトの見解を反映したものです。変化する市場状況に対応する必要があるため、このドキュメントは、記載された内容の実現に関するマイクロソフトの確約とはみなされないものとします。また、発行以降に発表される情報の正確性に関して、マイクロソフトはいかなる保証もいたしません。

このホワイト ペーパーに記載された内容は情報の提供のみを目的としており、明示、黙示または法律の規定にかかわらず、これらの情報についてマイクロソフトはいかなる責任も負わないものとします。

お客様ご自身の責任において、適用されるすべての著作権関連法規に従ったご使用を願います。このドキュメントのいかなる部分も、米国 Microsoft Corporation の書面による許諾を受けることなく、その目的を問わず、どのような形態であっても、複製または譲渡することは禁じられています。ここでいう形態とは、複写や記録など、電子的な、または物理的なすべての手段を含みます。ただしこれは、著作権法上のお客様の権利を制限するものではありません。

マイクロソフトは、このドキュメントに記載されている内容に関し、特許、特許申請、商標、著作権、またはその他の無体財産権を有する場合があります。別途マイクロソフトのライセンス契約上に明示の規定のない限り、このドキュメントはこれらの特許、商標、著作権、またはその他の無体財産権に関する権利をお客様に許諾するものではありません。

別途記載されていない場合、このソフトウェアおよび関連するドキュメントで使用している会社、組織、製品、ドメイン名、電子メール アドレス、ロゴ、人物、場所、出来事などの名称は架空のものです。実在する商品名、団体名、個人名などとは一切関係ありません。

© 2009 Microsoft Corporation. All rights reserved.

Microsoft、Windows、SharePoint、FAST、Visual Studio、SQL Server、OneNote、PowerPoint、Outlook、および Excel は、マイクロソフト グループの商標です。その他、記載されている会社名、製品名には、各社の商標のものもあります。

1www.microsoft.com/sharepoint

目次

概要1

このドキュメントの使い方2

はじめに4

SharePoint Server 2010 のエンタープライズ検索により解決される技術的な問題4

検索に関する用語5

マイクロソフトのエンタープライズ検索製品の概要10

マイクロソフトのサーバー側検索製品10

コンテンツ ソース リポジトリ11

インデックス作成の規模12

開発者向けの情報13

SharePoint Server 2010 の検索の新機能14

インフォメーション ワーカー向けの新機能と強化された機能14

クエリの新機能と強化された機能14

検索結果の新機能と強化された機能15

IT プロフェッショナル向けの新機能と強化された機能18

開発者向けの情報22

エンド ユーザーの検索エクスペリエンス23

ソーシャル検索27

検索管理30

検索アーキテクチャ30

スケーラビリティと可用性32

コンポーネント化とスケール変更33

高い可用性と復元力34

コネクタ フレームワーク35

新しいコネクタ機能35

コネクタの作成36

検索管理者向けのチュートリアル37

Search Service アプリケーション レベルでの検索管理37

クローラー設定37

コンテンツ ソースを作成する37

人の検索を構成する38

クロール ルールを作成する38

クローラー影響ルールを作成する39

クエリと結果の設定40

権限のあるページを作成する40

フェデレーション場所を作成する41

メタデータ プロパティを作成する44

検索レポート47

管理レポートを実行する48

Web 分析レポートを実行する49

サイト コレクション レベルでの検索管理49

Enterprise Search Center (エンタープライズ検索センター) を作成する50

キーワード、定義、おすすめコンテンツ、および類義語を作成する51

検索範囲を作成する52

付録 A: SharePoint Server 2010 の評価に使用できるリソース56

www.microsoft.com/japan/sharepoint

56www.microsoft.com/japan/sharepoint

概要

この評価ガイドは、Microsoft® SharePoint® Server 2010が提供するエンタープライズ検索機能の設計目標と詳細について理解していただくことを目的としています。また、SharePoint Server 2010 を使用してエンタープライズ検索を実装する方法について詳しく知っていただくことも目的としています。

このガイドには、以下の内容が含まれています。

· SharePoint Server 2010が提供する新しい、および強化された、エンタープライズ検索の機能とテクノロジの説明

· SharePoint Server 2010 に実装されている、インデックス作成とクエリのアーキテクチャの詳細

· SharePoint Server 2010 が提供する主要な検索機能の紹介とチュートリアル

このガイドは、技術的な意思決定者、IT プロフェッショナル、および開発者を対象としています。このガイドの全体的な目標は、SharePoint Server 2010 が提供する検索機能を徹底的かつ効果的に評価していただくための手助けをすることです。

SharePoint 2010 製品の最新情報については、http://www.microsoft.com/japan/sharepoint を参照してください。

このドキュメントの使い方

このドキュメントは、SharePoint Server 2010 が提供するエンタープライズ検索機能について理解、評価することができるように設計されています。このドキュメントには、SharePoint Server 2010 が提供するエンタープライズ検索のすべての機能とコンポーネントを以下の役割の観点から評価するために使用できる包括的な情報が含まれています。

· 技術的な意思決定者: エンタープライズ検索ソリューションが満たすビジネス要件を理解するために、このガイドを使用することができます。また、SharePoint Server 2010 が提供する検索テクノロジの特定の側面が、成功するエンタープライズ検索ソリューションのビジネス要件と技術要件を満たすためにどのように連携するかを学ぶこともできます。SharePoint Server 2010 のエンタープライズ検索機能のについて十分理解していただくため、以下の項目で構成しています。。

· はじめに

· マイクロソフトのエンタープライズ検索製品の概要

· SharePoint Server 2010 の検索の新機能

次に、組織のインフォメーション ワーカーが SharePoint Server 2010 のエンタープライズ検索機能をどのように使用するかの全体像をつかむために、以下のセクションに続きます。

· エンド ユーザーの検索エクスペリエンス

また、組織の IT プロフェッショナルや開発者が SharePoint Server 2010 のエンタープライズ検索機能をどのように使用するかの技術的な全体像をつかむために、このドキュメントの残りの部分を確認していただく必要があります。

· IT プロフェッショナル: SharePoint Server 2010 のエンタープライズ検索機能を構成および管理する方法を理解するために、このガイドを使用することができます。「検索管理」セクションには、IT プロフェッショナル向けの特に有益なアーキテクチャ情報が含まれています。また、「検索管理」セクションには、Search Service アプリケーション レベルおよびサイト コレクション レベルで管理操作を実行するための、順を追った説明も含まれています。

このガイドから得た洞察によって、カスタム ソリューションをより効果的に管理できるようになります。

· 開発者: SharePoint Server 2010 のエンタープライズ検索機能を理解するために、このガイドを使用することができます。ソリューションの開発を行うプラットフォームについての洞察を得ることができるように、このドキュメントのすべてのセクションを理解していただく必要があります。このガイドの中には、SharePoint Server 2010 のエンタープライズ検索用のカスタム ソリューションを作成する方法を理解するのに役立つ、「開発者向けの情報」のセクションが複数あります。より詳細な開発者向けのガイダンス、チュートリアル、およびサンプルについては、SharePoint Server 2010 SDK (英語) も参照してください。

はじめに

Microsoft SharePoint Server 2010 のエンタープライズ検索機能の評価ガイドをお読みいただきありがとうございます。このガイドの目標は、SharePoint Server 2010 が提供するエンタープライズ検索機能が組織のビジネス要件をどの程度満たすことができるかを評価するのに十分な SharePoint Server 2010 のエンタープライズ検索機能についての知識と理解を得ていただくための手助けをすることです。

このセクションでは、エンタープライズ検索ソリューションの技術要件、および SharePoint Server 2010 がこうした要件をどの程度満たすかについて学びます。

SharePoint Server 2010 のエンタープライズ検索により解決される技術的な問題

エンタープライズ検索ソリューションの一般的な目標を以下に示します。

· 複数のシステムのエンタープライズ データにインデックスを付けられるようにします。このようなデータには、SharePoint サイト、ファイル共有内のファイル、他の Web サイトの Web ページ、サード パーティのリポジトリ、および他の基幹業務システム (CRM データベースや ERP ソリューションなど) などに格納されている共用データが含まれます。

· 複数のエンタープライズ リポジトリ システムのコンテンツを、単独でもビジネス アプリケーションのコンテキスト内からでも検索できるようにします。理想を言えば、エンタープライズ検索ユーザー インターフェイスで検索を実行するユーザーは、SharePoint サイト、ファイル共有内のファイル、他の Web サイトのページ、およびカスタム ビジネス ソリューション内のデータを検索対象とした検索の結果を確認できる必要があります。これは、ユーザーは検索を開始する前にデータの場所を知る必要がないということでもあります。

· このような検索機能がユーザーに採用および使用されることを期待する場合は、適切な結果の正確なランキングが検索によって提供されるようにします。ユーザーがある検索エンジンを使い続ける主な理由は、適切な情報が検索結果の上位に返されるからです。同様に、ユーザーがある検索エンジンを使うのをやめる主な理由は、適切な結果が返されないから、または、関連ランキングが正確でないため適切な結果が上位に表示されないからです。

· エンタープライズ検索ソリューションで組織内の人や専門知識を特定できるようにします。最低でも、ユーザーは、連絡先情報と空き状況を取得するために組織内の他のメンバーの名前を検索することができる必要があります。理想を言えば、ユーザーは、皆さんのビジネスのトピックや機能領域への関心を表明したり、たびたびソート リーダーシップを発揮する専門家を見つけたりすることができる必要があります。検索ソリューションでは、通常のビジネス システム (電子メールやコンテンツ リポジトリなど) とのやり取りから、自動的にユーザー プロファイルを構築する必要があります。

SharePoint Server 2010 は、こうした目標を実現するためのエンタープライズ検索プラットフォームを提供します。概要を説明すると、SharePoint Server 2010 には、クローラーがさまざまな種類のコンテンツ ソースのファイル、メタデータ、および他の種類のデータにインデックスを付けることを可能にするコネクタ フレームワークが含まれています。FAST Search Server 2010 for SharePoint は、クロールされたデータを効率的にインデックス ファイルに格納するインデックス作成エンジンも提供します。また、クエリ サーバー、クエリ オブジェクト モデル、およびインデックスが付けられたデータに対して検索を実行するためのユーザー インターフェイスも提供します。

これらのコンポーネントそれぞれの詳細については後で説明しますが、今は、これらのコンポーネントすべてが、目標を実現しエンタープライズ検索ソリューションの要件を満たすために連携するということだけ心に留めておいてください。

検索に関する用語

SharePoint Server 2010 が提供するエンタープライズ検索機能について詳しく説明する前に、検索に関する用語とその定義を知っておくと、役に立つでしょう。次の表を使用して、このガイドで使用される用語の簡単な説明を確認することができます。

用語

定義

おすすめコンテンツ

おすすめコンテンツは、1 つ以上のキーワードに関連付けられているドキュメントの URL です。一般に、このようなドキュメントやサイトは、ユーザーが検索結果一覧の上位に表示されることを望むと思われるドキュメントやサイトです。おすすめコンテンツは、その URL にインデックスが付けられているかどうかにかかわらず、関連付けられているキーワードを含むクエリによって返されます。サイト コレクションの管理者は、キーワードを作成し、おすすめコンテンツをキーワードに関連付けることができます。

コネクタ

コネクタは、特定の種類のシステムと通信するコンポーネントです。インデックスを付けるコンテンツに接続してそのコンテンツを取得するために、クローラーによって使用されます。コネクタは、適切なプロトコルを使用して、インデックスを付けられるシステムと通信します。たとえば、共有フォルダーにインデックスを付けるために使用されるコネクタは FILE:// プロトコルを使用して通信し、Web サイトにインデックスを付けるために使用されるコネクタは HTTP:// プロトコルまたは HTTPS:// プロトコルを使用します。

コンテンツ ソース

コンテンツ ソースは、クロールされインデックスを付けられるシステムの定義です。たとえば、管理者は、共有ネットワーク フォルダー、SharePoint サイト、他の Web サイト、Exchange パブリック フォルダー、サード パーティ製アプリケーション、データベースなどを表すコンテンツ ソースを作成することができます。

クロール ルール

クロール ルールでは、インデックスを付けるコンテンツをクローラーがコンテンツ ソースからどのように取得するかを指定します。たとえば、クロール ルールでは、特定の種類のファイルがクロールから除外されるように指定したり、指定された範囲内の URL のクロールに特定のユーザー アカウントが使用されるように指定したりすることができます。s

クロール スケジュール

クロール スケジュールでは、コンテンツ ソースをクロールする頻度と日付/時刻を指定します。管理者は、すべてのクロール プロセスを手動で開始しなくて済むように、クロール スケジュールを作成します。

クロールされたプロパティ

クロールされたプロパティは、インデックスが付けられているコンテンツのメタデータを表します。一般に、クロールされたプロパティには、SharePoint リスト アイテムの列データ、Microsoft Office などのバイナリ ファイルのドキュメント プロパティ、および Web ページの HTML メタデータが含まれます。管理者は、有益な検索エクスペリエンスを提供するために、クロールされたプロパティを管理プロパティにマップします。詳細については、「管理プロパティ」を参照してください。

クローラー

クローラーは、コネクタを使用してコンテンツ ソースからコンテンツを取得するコンポーネントです。

クローラー影響ルール

クローラー影響ルールは、クローラーがソース システム内のコンテンツをクロールする際にソース システムにかける負荷を規定します。たとえば、あるクローラー影響ルールでは、インフォメーション ワーカーがあまり頻繁に使用しないあるコンテンツ ソースのクロールでは 64 個のドキュメントを同時に要求する必要があることを指定し、別のクローラー影響ルールでは、インフォメーション ワーカーが絶えず使用するシステム用に、より負荷の低いクロール特性を指定することができます。

フェデレーション

フェデレーションは、インフォメーション ワーカーによって実行された 1 つのクエリに基づいて、複数の検索プロバイダーから検索結果を取得するという概念です。たとえば、組織では、Bing.com とのフェデレーションを採用して、あるクエリの結果が SharePoint と Bing.com から返されるようにすることができます。

IFilter

IFilter は、特定の種類のファイルのコンテンツを読み取るためにコネクタによって使用されます。たとえば、Word IFilter は Word 文書を読み取るために使用され、PDF IFilter は PDF ファイルを読み取るために使用されます。

インデックス

インデックスは、インデックスが付けられたコンテンツが収録されている物理的なファイルで、クエリを遂行するためにクエリ サーバーによって使用されます。

インデクサー

インデクサーは、1 つのインデックスに含まれるコンテンツを管理し、そのコンテンツをクエリ サーバーに伝達します。クエリ サーバーでは、コンテンツはインデックス ファイルに格納されます。

インデックス作成エンジン

「インデクサー」を参照してください。

インデックス パーティション

「パーティション分割されたインデックス」を参照してください。

管理プロパティ

管理者は、1 つ以上のクロールされたプロパティにマップすることによって管理プロパティを作成します。たとえば、管理者は、コンテンツ ソースの異なる Customer、Client、および Cust という複数のクロールされたプロパティにマップされる Client という名前の管理プロパティを作成することができます。その後、管理プロパティはエンタープライズ検索ソリューション全体で (検索範囲の定義やクエリ フィルターの適用などに) 使用することができます。

OpenSearch

OpenSearch は、フェデレーション シナリオで規格に準拠した検索エンジンを使用することを可能にする業界標準です。詳細については、「フェデレーション」を参照してください。

パーティション分割されたインデックス

SharePoint Server 2010 には、管理者がクエリの負荷を複数のクエリ サーバーに分散させることを可能にする新しい概念が導入されています。これは、インデックスのサブセットを作成し、個々のサブセットを異なるクエリ サーバーに伝達することによって実現されます。サブセットは "パーティション" と呼ばれます。ユーザーに返す必要のある結果がすべて含まれるように、クエリ時に、クエリ オブジェクト モデルは、検索を遂行できる各クエリ サーバーにアクセスします。

プロパティ データベース

検索結果の管理プロパティとセキュリティ記述子は、物理的なインデックス ファイルには格納されません。これらは、クエリ サーバーに伝達される効率的なデータベースに格納されます。クエリ サーバーは一般に、インデックス ファイルとプロパティ データベースの両方から情報を取得することによってクエリを遂行します。

クエリ オブジェクト モデル

クエリ オブジェクト モデルは、検索ユーザー インターフェイスから入力を受け取る役割と、クエリ サーバーに適切なクエリを発行する役割を担います。SharePoint Server 2010 が提供する検索 Web パーツでは、クエリ オブジェクト モデルを使用してクエリが実行されます。開発者は、クエリ オブジェクト モデルを使用してクエリを実行するカスタムのユーザー インターフェイスとソリューションを作成することもできます。

クエリ サーバー

クエリ サーバーは、クエリを遂行するために、インデックス ファイルとプロパティ データベースからデータを取得します。

ランキング

ランキングでは、クエリから返される結果の並べ替え順序を定義します。一般に、結果は、最も関連性の高いドキュメントが結果ページの上部に表示されるように、関連性に基づいて降順に並べ替えられます。しかし、インフォメーション ワーカーは、別の並べ替え順序 (更新日時など) を適用することを選ぶ場合があります。

関連性

関連性は、ある検索がユーザーの情報ニーズをどの程度満たすかを表します。関連性には、どのドキュメントが結果で返されるか (ドキュメントの再現率)、および結果内でのドキュメントの順序 (ランキング) が含まれます。

検索センター

検索センターは、検索センターのサイト テンプレートをベースとしたサイトです。インフォメーション ワーカーがクエリを実行して検索結果を処理することができる、的が絞られたユーザー インターフェイスを提供します。

検索ドキュメント

「検索項目」を参照してください。

検索項目

検索項目は、ドキュメント、リスト アイテム、ファイル、Web ページ、Exchange パブリック フォルダーへの投稿、またはインデックスの付けられたデータベース行を表します。検索項目は "検索ドキュメント" と呼ばれることもありますが、重要なのは、こうした項目が検索クエリによって返されるということです。

ステミング

各言語には、複数の形を持つが本質的に同じことを意味する単語が存在する場合があります。たとえば、"To Write" という動詞には、"writing"、"wrote"、"write"、"writes" という形があります。同様に、英語の名詞には通常、"book" と "books" のように、単数形と複数形があります。エンタープライズ検索のステミング機能では、ある単語の 1 つの形がその単語の他の形にマップされることにより、適切なドキュメントの再現率が向上することがあります。

ストップ ワード

ストップ ワード (ノイズ ワードと呼ばれることもあります) とは、インデックスを付けても意味がない単語のことです。英語には、いくつかのストップ ワードが含まれています ("a"、"and"、"the" など)。このような単語は、インデックスが付けられた項目の多くに含まれている可能性が高いので、このような単語にインデックスを付けても意味がありません。また、インフォメーション ワーカーがこの種の語だけを検索することはめったにありません。

類義語

類義語とは、他の単語と同じことを意味する単語のことです。たとえば、"ラップトップ" と "ノートブック" は同じことを意味すると考えることができます。管理者は、組織でインフォメーション ワーカーが検索する可能性のあるキーワードの類義語を作成することができます。また、適切なドキュメントの再現率を向上させるために使用できる類義語はシソーラス ファイルに格納されます。

ワード ブレーカー

コンテンツ ソースからストリームや単語が取得され、こうしたストリームはインデックス作成のために個々の単語に分解されます。ワード ブレーカーとは、ストリームを個々の単語に分解するコンポーネントのことです。インデックスが付けられるストリームは、通常、スペース、句読点、および各言語特有の規則を識別することによって分解されます。また、ユーザーが複数の単語を検索ボックスに入力すると、そのクエリはワード ブレーカーによって個々の語に分解されます。

マイクロソフトのエンタープライズ検索製品の概要

マイクロソフトはさまざまな検索製品を提供しているので、SharePoint Server 2010 のエンタープライズ検索について詳しく説明する前に、エンタープライズ検索ポートフォリオのすべての製品について知っておくと、役に立つでしょう。

マイクロソフトのサーバー側検索製品

製品によって程度に差はありますが、次の製品はすべて、インデックス作成と検索の機能を提供します。

· Microsoft SharePoint Foundation 2010 の検索

· Microsoft Search Server 2010 Express

· Microsoft Search Server 2010

· Microsoft SharePoint Server 2010

· FAST™ Search Server 2010 for SharePoint*

次の表を使用して、各製品が提供する検索機能をすばやく比較することができます。

機能

SharePoint Foundation 2010

Search Server 2010 Express

Search Server 2010

SharePoint Server 2010

FAST Search Server 2010 for SharePoint

基本的なサイト検索

おすすめコンテンツ

ビジュアルおすすめコンテンツ

類似する結果

重複する結果

検索範囲

ユーザー コンテキストに基づく、検索の機能強化

クロールされたプロパティと管理プロパティ

○*

クエリ フェデレーション

クエリ候補

管理プロパティやランク プロファイルに基づく結果の並べ替え

ドキュメントやサイトの昇格による関連性の調整

○*

結果の大まかな絞り込み条件

結果の詳細な絞り込み条件

ドキュメントのプレビュー

Windows 7 フェデレーション

人の検索

ソーシャル検索

分類の統合

マルチテナント型のホスティング

充実した Web インデックス作成のサポート

* - FAST Search Server 2010 for SharePoint が強化された機能を提供する領域を示します。詳細については、FAST Search Server 2010 for SharePoint の評価ガイドを参照してください。

上記の表に記載されている機能の詳細については、後のセクションで説明します。

コンテンツ ソース リポジトリ

機能を比較するだけでなく、各製品でクロールできるコンテンツ ソースの種類についても考える必要があります。

· SharePoint Foundation 2010 でクロールできるのは、同じファーム内にある SharePoint サイトのみです。

· 上記の表に記載されている製品のうち、SharePoint Foundation 2010 以外のすべての製品では、次の種類のコンテンツ ソースをクロールすることができます。

· (同じファーム内、または外部のファーム内にある) SharePoint サイト

· Windows ファイル共有

· Microsoft Exchange パブリック フォルダー

· SharePoint 以外の Web サイト

· ユーザー プロファイル

· 外部の基幹業務アプリケーション

· データベース内の構造化されたコンテンツ

· Web サービスから返されたコンテンツ

· Lotus Notes や Documentum などの、サード パーティの製品やソリューション

注: Microsoft SharePoint 2010 Indexing Connector for Documentum (Beta) は、Microsoft Connect (https://connect.microsoft.com/office/Downloads/DownloadDetails.aspx?DownloadID=23324、英語) から別個にダウンロードすることができます。

インデックス作成の規模

上記の表に記載されているどの製品でも、インデックスを付けることができる項目の数に関して、ハードコーディングされた限度はありませんが、実現性とパフォーマンスに基づく次のようないくつかの実用的なガイドラインがあります。

· SharePoint Foundation 2010 でインデックス付けと検索を行うことができる項目の数は、サーバー 1 台につき最大 1,000 万個です。

· Search Server 2010 Express でインデックス付けと検索を行うことができる項目の数は、SQL Server® Express と併用した場合は最大 30 万個で、それ以外の場合は最大 1,000 万個です。

· スケールアウトされた Search Server 2010 ファームでインデックス付けと検索を行うことができる項目の数は、最大 1 億 個です。

· スケールアウトされた SharePoint Server 2010 ファームでインデックス付けと検索を行うことができる項目の数は、最大 1 億 個です。

· FAST Search Server 2010 for SharePoint は最大の規模をサポートすることができ、インデックス付けと検索を行うことができる項目の数は 10 億個を超えます。

SharePoint Server 2010 によるエンタープライズ検索の一般的な目標の 1 つは、すべての検索でクエリの待ち時間が 1 秒未満になるようにすることです。これを実現するには、1 台のクエリ サーバーが処理する項目の数が 1,000 万個を超えないようにします。ファームに複数のクエリ サーバーを追加して、SharePoint Server 2010 の新機能であるインデックスのパーティション分割機能を利用することにより、これを実現することができます。インデックスをパーティション分割すると、管理者は、クエリの負荷を複数のクエリ サーバーに分散させることができます。これは、インデックスのサブセットを作成し、個々のサブセットを異なるクエリ サーバーに伝達することによって実現されます。SharePoint Server 2010 は、各ドキュメントの ID のハッシュを使用して、特定のドキュメントのインデックス エントリをどのパーティションに格納するべきかを判断します。ユーザーに返す必要のある結果がすべて含まれるように、クエリ時に、クエリ オブジェクト モデルは、検索を遂行するために必要な各クエリ サーバーにアクセスします。

マイクロソフトのサーバー側検索製品の比較の詳細については、「Search Technologies for SharePoint 2010 Products」(英語) を参照してください。

開発者向けの情報

上記の製品はすべて、統一されたクエリ オブジェクト モデルを提供します。そのため、たとえば、SharePoint Foundation 2010 用のクエリ オブジェクト モデルを使用するカスタム ソリューションを開発した場合、SharePoint Server 2010 にアップグレードしても、または、コードを FAST™ Search Server 2010 for SharePoint に移行しても、このソリューションは機能し続けます。

SharePoint Server 2010 の検索の新機能

SharePoint Server 2010 のエンタープライズ検索の新機能の概要をつかむために、このセクションを使用することができます。

インフォメーション ワーカー向けの新機能と強化された機能

SharePoint Server 2010 には、クエリを構築し送信したり、検索結果を処理したりするための新機能が用意されています。

クエリの新機能と強化された機能

SharePoint Server 2010 を使用すると、エンド ユーザーは、より効果的な検索クエリを作成し実行することができます。また、SharePoint Server 2010 を使用すると、ユーザーは、Windows 7 のデスクトップから検索クエリを発行することができます。

新しいクエリ機能を以下に示します。

· フリーテキスト クエリおよびプロパティ クエリ用のブール クエリ構文SharePoint Server 2010 は、検索クエリでのブール演算子 AND、OR、および NOT の使用をサポートしています。たとえば、ユーザーは、次のようなクエリを実行することができます。("SharePoint Search" OR "Live Search") AND (title:"Keyword Syntax" OR title:"Query Syntax")

· 検索キーワードおよびドキュメント プロパティのプレフィックス照合検索クエリでは、アスタリスク (*) 記号をワイルドカード文字としてテキスト文字列の末尾で使用することができます。たとえば、"comp*" という検索クエリを使用すると、"computer"、"component"、"competency" などの文字列が含まれるドキュメントを見つけることができます。同様に、"author:Ad*" というクエリを使用すると、"Adam" や "Administrator" によって作成されたドキュメントを見つけることができます。したがって、"comp* author:ad*" というクエリを使用すると、"Adam" によって作成された "component" という文字列が含まれるドキュメントや、"Administrator" によって作成された "computer" という文字列が含まれるドキュメントを見つけることができます。

· 検索クエリの入力中に提供される候補ユーザーが検索センターの検索ボックスにキーワードを入力すると、クエリを完成させるのに役立つ候補が提供されます。こうした候補は、他のユーザーが以前に使用したクエリに基づいています。

· ユーザーがクエリを実行した後で提供される候補検索センターでは、クエリが実行された後にも候補が提供されます。こうした候補も他のユーザーが以前に使用したクエリに基づいており、"検索語句の候補" 機能とは異なります。

· Windows 7 でのエンタープライズ検索用のコネクタユーザーは、Enterprise Search Center (エンタープライズ検索センター) から、Windows 7 での SharePoint 検索用のコネクタを容易に作成することができます。Windows 7 の検索ボックスに検索クエリを入力することにより、ユーザーは、SharePoint から関連するドキュメントを見つけ、検索結果で返されたドキュメントのファイル プレビューやドラッグ アンド ドロップなどの Windows の機能を活用することができます。

検索結果の新機能と強化された機能

SharePoint Server 2010 では、検索結果の取得と表示に関して多くの機能強化が加えられています。新しい検索結果機能を以下に示します。

· 結果の表示検索結果ページには絞り込み条件パネルが含まれています。このパネルは、検索結果の概要を提供し、ユーザーが結果をすばやく閲覧し理解することを可能にします。たとえば、ある検索クエリに対する検索結果ページの絞り込み条件パネルに表示される概要では、多数の Web ページ、および特定の作成者による多数のドキュメントが検索結果に含まれることが示される可能性があります。また、結果の上位のほとんどは Microsoft Word® 文書と Microsoft Excel® ドキュメントであることも示される可能性があります。絞り込み条件パネルを使用すると、ユーザーは、たとえば、コンテンツの種類 (ドキュメント、スプレッドシート、プレゼンテーション、Web ページなど)、コンテンツの場所 (SharePoint サイトなど)、コンテンツの作成者、または最終更新日時に基づいて、結果をフィルター処理することもできます。ユーザーは、管理者が構成した管理プロパティおよびエンタープライズ コンテンツ管理 (ECM) 分類ノードをベースとしたカテゴリに基づいてフィルター処理をすることもできます。

· ブラウザーで表示"ブラウザーで表示" 機能により、ユーザーは、Office Web アプリケーションを使用してほとんどの Microsoft Office ドキュメントをブラウザーで表示できるようになります。Office Web アプリケーションは、Word、Excel、Microsoft PowerPoint®、および Microsoft OneNote® のオンライン版で、これを使用すると、インフォメーション ワーカーはあらゆる場所からドキュメントにアクセスすることができます。ユーザーは、パーソナル コンピューター、携帯電話、および Web ブラウザーを使用して、ドキュメントの表示、共有、および共同作業を行うことができます。Office Web アプリケーションは、Windows Live を通じてユーザーに提供されます。また、Microsoft Office 2010 ボリューム ライセンス契約を結ばれている、SharePoint Server 2010 をベースとしたドキュメント管理ソリューションをお使いの企業のお客様にも提供されます。

· 人の検索人の検索を使用すると、ユーザーは、名前だけでなく、他の多くのカテゴリ (部署、役職、プロジェクト、専門知識、場所など) に基づいて組織内の人を見つけることができます。人の検索に加えられた機能強化を以下に示します。

· 人の検索の結果の関連性が向上人の検索の結果の関連性が向上しています (特に、名前と専門知識に基づく検索の場合)。

· 自己検索ユーザーが自分のプロファイルにデータを追加すると、人の検索の効果は高まります。ユーザーが自分自身に対する検索を実行すると、検索システムでは、これを "自己検索" と認識し、関連するメタデータを表示します。表示されるメタデータには、その個人用サイトのプロファイルが閲覧された回数や、そのユーザーの名前が検索結果として返された検索で他の人が検索時に入力した語句などの情報が含まれる場合があります。これにより、ユーザーは、他のユーザーが検索を行う際に役立つように自分のプロファイル ページに情報を追加しようという気になる可能性があります。ユーザーが個人用サイトのプロファイルを更新すると、他のユーザーはその後の検索でそのユーザーをより容易に見つけられるようになります。これはビジネス上の関心や責務が共通する人をつなぐのに役立つため、生産性の向上をもたらします。

· 音声上の名前照合とニックネームの照合ユーザーは、名前の正確なスペルがわからなくても、組織内の人を検索することができます。たとえば、"John Steal" という検索クエリを使用すると検索結果には "John Steele" が含まれる可能性があり、"Jeff" という検索クエリを使用した検索の結果には "Geoff" を含む名前が含まれる可能性があります。また、ニックネームの照合により、"Bill" に対する検索クエリを使用して "William" を含む結果を得ることが可能になります。注: 音声上の名前照合は、SharePoint Server 2010 でサポートされている以下の言語に適用されます。

· 英語

· スペイン語

· フランス語

· ドイツ語

· イタリア語

· 韓国語

· ポルトガル語 (ブラジル)

· ロシア語

注: ニックネームの照合は、SharePoint でサポートされている以下の言語に適用されます。

· 英語

· スペイン語

· ドイツ語

· オランダ語

· 検索結果の関連性に関する機能強化SharePoint Server 2010 では、検索結果の関連性と有効性を向上させるための次のような機能強化が提供されます。

· クリックスルー履歴に基づくランキング検索結果セット内のあるドキュメントがユーザーによって頻繁にクリックされる場合、それは、インフォメーション ワーカーがそのドキュメントを役に立つと感じていることを示します。したがって、そのドキュメントは、検索結果のランキングの中で、より上位に昇格されます。

· 抽出されたメタデータに基づく関連性ドキュメントのコンテンツと共に、ドキュメントのメタデータにもインデックスが付けられます。しかし、インフォメーション ワーカーは常にメタデータを適切に更新するとは限りません。たとえば、インフォメーション ワーカーは他の人によって作成されたドキュメントを別の形式に変換することがよくありますが、"作成者" プロパティを更新しない場合があります。この場合、元の作成者の名前がプロパティ シートに残るため、元の作成者の名前にインデックスが付けられます。しかし、検索システムでは、ドキュメント内のフレーズから作成者を特定できる場合があります。たとえば、検索システムは、ドキュメント内の "By John Doe" のようなフレーズから作成者を推測することができます。この場合、SharePoint Server 2010 は元の作成者を保持しますが、"John Doe" という隠れた値も保持します。そして、ユーザーが特定の作成者に基づいてドキュメントを検索すると、どちらの値も同様に扱われます。

IT プロフェッショナル向けの新機能と強化された機能

SharePoint Server 2010 には、管理者が情報を検索するエンド ユーザーに最大の利益を提供できるようにするための新しい方法が用意されています。IT プロフェッショナルは、次の新機能と強化された機能を活用することができます。

· 強化された管理インターフェイスSharePoint Server 2010 には、Office SharePoint Server 2007 を展開してから Microsoft Office サーバー製品インフラストラクチャ更新プログラムをインストールした組織に最初に提供された新しい検索管理ページが含まれています。この新しいインターフェイスでは、管理タスクを実行するための場所が一元化されます。SharePoint Server 2010 では、次のメリットをもたらすインターフェイスが管理者に提供されます。

· ファーム規模の管理タスクすべて (検索管理を含む) の単一の出発点。最も一般的な検索タスクが強調表示されています。

· ファーム管理者と検索管理者がサーバーの状態と動作を監視できる一元的な場所。

· ファームの構成ウィザードインストール ウィザードが完了すると、ファームの構成ウィザードが自動的に実行されます。ファームの構成ウィザードは、小規模なファームの展開を簡略化するのに役立ちます。このウィザードは、既定の設定を使用して最初の構成プロセスのほとんどを自動化するオプションを提供します。たとえば、ファームの構成ウィザードを使用して、ファームで最初のアプリケーション サーバーを展開すると、ウィザードによって自動的に、以下のものを含む十分機能する検索システムがそのサーバー上に作成されます。

· ユーザーがクエリを発行できる検索センター (製品をインストールしたユーザーが、ファームのインストール ウィザードでこのオプションを選択した場合)

· 最大 1,000 万個のクロールされたドキュメントのインデックスをサポートできる、十分機能する検索トポロジ

· ファームの構成ウィザードの実行が完了した直後にサーバー ファーム内の SharePoint サイトをクロールする機能

· 他の共有サービスから切り離された Search サービス管理Microsoft Office SharePoint Server 2007 では、Office SharePoint Server Search サービスは、共有サービス プロバイダー (SSP) の他の共有サービス (Excel Calculation Services など) と一体でした。そのアーキテクチャでは、新しい SSP を作成せずに新しい Search サービスを作成することはできませんでした。それに対して、SharePoint Server 2010 では、Search サービス アプリケーションを互いに切り離して、また、他のサービス アプリケーションと切り離して作成および管理することができます。

· 管理タスク自動化のサポートの拡張Windows PowerShell™ 2.0 スクリプトを使用して、多くの検索管理タスクを自動化することができます。たとえば、Windows PowerShell 2.0 スクリプトを使用して、コンテンツ ソースや検索システムのトポロジを管理することができます。Windows PowerShell のサポートは、SharePoint Server 2010 で新たに導入されました。

· パフォーマンス、処理能力、および信頼性の向上SharePoint Server 2010 には、次のように、パフォーマンス、処理能力、および信頼性の向上を目指して検索ソリューションを構成および最適化するための新しい方法が多数用意されています。

· クロール機能を強化するためのスケーラビリティMicrosoft Office SharePoint Server 2007 では、共有サービス プロバイダーは 1 つのインデクサーを使用するように構成することしかできませんでした。SharePoint Server 2010 では、追加のサーバーをファームに追加しクローラーとして構成することによって、クロール コンポーネントの数を変更することができます。これにより、以下のことが可能になります。

· クロールの頻度を高め、量を増やす。これは、検索システムがより包括的で現状に即した結果を提供するのに役立ちます。

· クロールの負荷を分散させることにより、パフォーマンスを向上させる。

· あるサーバーが機能しなくなった場合に、冗長性を提供する。

· スループットを向上させ待ち時間を短縮するためのスケーラビリティ以下の目的で、クエリ コンポーネントの数を増やすことができます。

· クエリのスループットを向上させる。つまり、検索システムが同時に処理することができるクエリの数を増やすということです。

· クエリの待ち時間を短縮する。つまり、検索結果の取得にかかる時間を短縮するということです。SharePoint Server 2010 によるエンタープライズ検索の一般的な目標の 1 つは、すべての検索でクエリの待ち時間が 1 秒未満になるようにすることです。これを実現するには、1 台のクエリ サーバーが処理する項目の数が 1,000 万個を超えないようにします。ファームに複数のクエリ サーバーを追加して、SharePoint Server 2010 の新機能であるインデックスのパーティション分割機能を利用することにより、これを実現することができます。Microsoft Office SharePoint Server 2007 では、インデックスのパーティション分割という概念はサポートされていませんでした。

· クエリ コンポーネントにフェールオーバー機能を提供する。

· 通常の運用中のトポロジ管理通常のファーム運用中に、ユーザーが検索機能を使用できる状態を維持したままで、既存の検索トポロジを調整することができます。たとえば、通常の運用中に、変化する状況に対応するために追加のインデックス パーティションとクエリ コンポーネントを展開することができます。

· 運用管理SharePoint Server 2010 には、ファームの運用を監視しエンタープライズ検索用にレポートをカスタマイズするための新機能が用意されています。具体的に言うと、管理者は、全体管理 Web サイトの検索管理ページで状態情報とトポロジ情報を確認することができます。管理者はクロール ログや正常性レポートを確認することもでき、Systems Center Operations Manager を使用して検索システムの監視とトラブルシューティングを行うことができます。

· 正常性とパフォーマンスの監視正常性とパフォーマンスの監視機能を使用すると、管理者はファームでの検索操作を監視することができます。これは、クロール状態とクエリ パフォーマンスを監視するのに特に役立つ場合があります。SharePoint Server 2010 には、構成、パフォーマンス、および使用に関する潜在的な問題の有無を自動的に確認するために使用できる正常性分析ツールが含まれています。検索管理者は、次のような独自の正常性レポート ジョブを構成することができます。

· 定義済みのスケジュールに基づいて実行される。

· 問題が見つかった場合に管理者に通知する。

· パフォーマンスの監視、処理能力の計画、およびトラブルシューティングに使用できるレポートを構築する。

· 検索分析レポートSharePoint Server 2010 では、検索システムの運用を分析して検索クエリに対して最良の結果が返されるように検索システムを調整するのに役立つ新しいレポートが提供されます。たとえば、レポートには、クエリで最も頻繁に使用される語句や特定の期間内に発行されたクエリの数に関する情報が含まれる場合があります。クエリのピーク タイムに関する情報は、サーバー ファームのトポロジやクロールを行うのに最適なタイミングを決めるのに役立ちます。

· クロールによるさまざまなコンテンツの検索SharePoint Server 2010 では、クロールとフェデレーションにより、SharePoint サイト以外のリポジトリに格納されているコンテンツを検索することができます。たとえば、検索システムでは、SharePoint Server 2010 に付属するコネクタを使用して、ファイル共有、Exchange パブリック フォルダー、Lotus Notes などのリポジトリに格納されているコンテンツをクロールすることができます。データベースやサード パーティ製アプリケーションのデータをクロールするための追加のコネクタは、Business Connectivity Services のコネクタ フレームワークを使用して容易に作成することができます。SharePoint Designer 2010 や Microsoft Visual Studio® 2010 を使用したコネクタ作成がサポートされているため、Microsoft Office SharePoint Server 2007 のプロトコル ハンドラーと比べて、より迅速かつ容易に開発を行うことができます。

· フェデレーションによるさまざまなコンテンツの検索SharePoint Server 2010 の検索結果には、他の検索エンジンから取得したコンテンツを含めることができます。たとえば、管理者は、www.bing.com や組織内の地理的に分散した場所から取得した検索結果を統合することができます。

開発者向けの情報

SharePoint Server 2010 が管理者とインフォメーション ワーカー向けに提供する新しいエンタープライズ検索機能はすべて、更新されたクエリ オブジェクト モデルおよび管理オブジェクト モデルに反映されています。

たとえば、クエリを実行して検索結果を表示するための独自のカスタム ユーザー インターフェイスを開発する場合、おすすめコンテンツなどの機能にプログラムからアクセスすることができます。また、以前のバージョンと比べて、開発者は検索と結果の組み込みの Web パーツを扱いやすくなっています。

同様に、管理オブジェクト モデルを使用して、組織のエンタープライズ検索を管理するための管理アプリケーションを作成することもできます。たとえば、開発者は、管理者がコンテンツ ソース、クロール ルール、優先度などを作成できるウィザードを作成することができます。

このガイドでは、クエリ オブジェクト モデル、管理オブジェクト モデル、および開発手法について詳しくは説明しませんが、MSDN の SharePoint デベロッパー センターを使用して、エンタープライズ検索ソリューションを開発する方法について学ぶことができます。このガイドの後のセクションにも、開発者向けの厳選された情報が含まれています。

エンド ユーザーの検索エクスペリエンス

インフォメーション ワーカーは一般に、簡易検索ボックスを使用するか、検索センターのサイト テンプレートをベースとしたサイトにアクセスして、検索を開始します。図 1 は、すべてのサイト ページに既定で用意されている簡易検索ボックスを示しています。既定では、この検索ボックスでは、現在のサイトを対象としたクエリが発行されます。ユーザーは、検索を実行する前に、必要な情報があるとわかっているサイトに移動することが多いからです。

図 1 は、Enterprise Search Center (エンタープライズ検索センター) のテンプレートをベースとした検索サイトへのナビゲーションも示しています。インフォメーション ワーカーは、検索センター サイトを使用して、すべてのクロールされたフェデレーション コンテンツを対象とした検索を行います。

(簡易検索ボックス検索センターへのナビゲーション) (図 1. SharePoint サイトでの検索)

図 2 は、Enterprise Search Center のテンプレートをベースとした検索サイトを示しています。

図 2. 検索センター

現在のユーザーの検索設定へのリンクと高度な検索オプションへのリンクが付いた高度な検索のボックスが検索センターに用意されていることに注目してください。また、検索センターには、検索タブ ([All Sites] (すべてのサイト) タブ、および人の検索専用のタブ) が既定で用意されています。人の検索の詳細については、このセクションで後で説明します。

図 3. 高度な検索

図 3 は、高度な検索を実行するための既定のビューを示しています。既定のビューでは、フレーズ管理機能、言語フィルター、検索結果の種類のフィルター、およびプロパティ フィルターを利用することができます。

すべての検索ユーザー インターフェイスは直感的で使いやすいので、インフォメーション ワーカーは非常に簡単に検索を開始することができます。インフォメーション ワーカーが検索を実行すると、図 4 に示すように結果が結果ページに表示されます。SharePoint Sever 2010 の検索の主要結果ページは、非常にユーザー フレンドリで直感的なユーザー インターフェイスを提供します。ユーザーは単純でなじみのあるキーワード クエリを使用することができ、充実した移動しやすいレイアウトで結果を得ることができます。検索センターのサイト テンプレート、および SharePoint Server 2010 サイトのすべてのページで使用できる簡易検索ボックスが提供されます。

図 4. SharePoint Server 2010 の検索結果ページ

検索結果は閲覧および理解するのが簡単で、検索結果には、インフォメーション ワーカーが結果を理解し探索するのに役立ついくつかの機能が含まれています。それぞれの結果には抜粋が添えられ、結果一覧の最後に定義が示されます (こうした抜粋や定義は、クエリ対象の単語がコンテンツ内で出てくるコンテキストに基づいて自動生成されます)。スペルが間違っているクエリやあいまいなクエリに対しては手助けとなるように検索語句の候補が表示され、関連検索セクションでは頭字語が展開されます。たとえば、ECM を検索すると Enterprise Content Management の検索結果が返され、Enterprise Content Management を検索すると ECM の検索結果が返されます。結果は通常、1 秒未満の応答時間で返されます。

インフォメーション ワーカーは、トピックを監視したり検索を繰り返したりする際の時間を節約するために、いくつかの方法で検索をマークすることができます。検索結果の RSS フィードを購読したり、後で再利用するために検索をブックマークしたりすることができます。また、スケジュールされた間隔でクエリを再実行し電子メールやテキスト メッセージで結果の変化をユーザーに知らせる通知を、すばやく作成することもできます。

SharePoint Server 2010 は、より関連性の高い結果を提供します。より表現力が豊かなクエリを作成できるようにクエリ構文が強化されています。より複雑な表現をクエリに使用したいと考えているパワー ユーザー向けに、引き続き高度な検索が提供されます。中核的な関連ランキングにも大幅な機能強化が加えられ、追加のテキスト フィールドを使用したり、コンテンツの構造を利用したり、検索エンジンのランキングのクリックスルーや最適化を行ったりすることができるようになりました。多くの言語で言語の検出を強化し再現率を向上させるため、言語学も強化されました。

図 5 に示すように、SharePoint Server 2010 では、情報を探索するための新しい方法も (検索の絞り込み条件を通じて) 提供されます。こうした絞り込み条件は、主要な検索結果のページの左側に縦に表示され、返された検索結果をフィルター処理するためのセルフサービスのドリルダウン機能を提供します。絞り込み条件となる項目は、検索結果に含まれるタグとメタデータを使用して SharePoint Server 2010 によって自動的に決定されます。こうした絞り込み条件には、コンテンツの種類 (Web ページ、ドキュメント、スプレッドシート、プレゼンテーションなど)、場所、作成者、最終更新日時、およびメタデータ タグに基づく検索が含まれます。管理者は、容易に絞り込み条件パネルを拡張して、任意の管理プロパティに基づく絞り込み条件を追加することができます。

図 5 . 検索結果の絞り込み条件

既定のユーザー インターフェイスは非常に直感的でインフォメーション ワーカーにとって便利ですが、パワー ユーザーは独自の検索エクスペリエンスを作成することができます。SharePoint Server 2010 には、パワー ユーザーがおすすめコンテンツ、絞り込み条件パネルの拡張機能、注目のコンテンツ、定義済みクエリなどを含むカスタマイズされた検索エクスペリエンスを作成するための、検索関連の Web パーツが多数用意されています。図 6 は、検索 Web パーツを示しています。

図 6. 検索 Web パーツ

ソーシャル検索

組織における人の働きの重要な側面は、他の人とやり取りし、特定のスキルや才能を持った連絡を取るべき適切な人材を見つけることです。大規模な組織では、これは手ごわい課題である場合があります。SharePoint Server 2010 は検索を通じてこの課題に対処し、この検索を SharePoint Server 2010 のソーシャル機能と結び付けます。人の検索センターは、人とつながるための専用の機能を提供します。

人を見つける

SharePoint Server 2010 では、名前の照合が強化されたアドレス帳スタイルの名前検索エクスペリエンスが提供され、名前、役職、および組織構造に基づいて人を検索するのがより容易になります。このエクスペリエンスには、ユーザーがクエリで入力したものと音声上似ている名前を返す音声上の名前照合が含まれます (これは一部の言語にのみ適用されます)。また、一般的な名前のすべてのバリエーション (ニックネームを含む) も返されます (これは一部の言語にのみ適用されます)。

主要な検索結果で提供される絞り込み条件は、人の検索の結果でも提供されます。名前、役職、およびユーザーのプロファイルのさまざまなフィールドを通じて結果を探索すると、人をすばやく閲覧および選択することができます。人の検索の結果には Office Communications Server によるリアルタイム プレゼンスも含まれているため、検索を通じて見つかった人にすぐに連絡を取るのが容易になります。図 7 は、人の検索の結果ページを示しています。

図 7. 人の検索の結果ページ

専門知識を引き出し見つけ出す

ユーザーは、Outlook® から引き出された仕事仲間の一覧を手動で送信したり自動的に生成したりすることができます。自動生成された仕事仲間一覧は組織全体にわたって社会的関係をすばやく推測するための手段であり、これを使用すると、人の検索の結果の採用が迅速化され有用性の実現が促進されます。SharePoint Server 2010 では、専門知識の推測も行われます (ユーザーの Outlook 受信トレイから引き出されたトピックが自動的に候補として提案され、ユーザーの個人用サイト内の専門知識プロファイルへの追加が提案されます)。これにより、個人用サイトのプロファイルにデータを設定するのが容易になります。また、これは、より多くの人が、データが十分に設定されたプロファイルを持ち、検索とコミュニティの両方でこのメリットを得ることを意味します。

社会的行動に基づいて検索を強化する

多くの組織にとって、SharePoint サイトは、人々が集まって情報を作成、共有、および処理する場になりました。いくつかの方法で質の高い検索結果を提供するために、社会的行動が考慮に入れられます。人の検索の関連ランキングでは社会的距離が考慮に入れられ、直接の同僚は 3 階級離れた仕事仲間よりも上位にランク付けられます。また、SharePoint Server 2010 はコンテンツへのソーシャル タグ付けをサポートしており、このフィードバックは検索結果におけるコンテンツの関連性に影響を与える場合があります。SharePoint Server 2010 と Microsoft Office で日々どのように情報が使用されるかは、検索の関連性に大きな影響を与える場合があるので、組織がメンバーの衆知を利用するのに役立ちます。

検索管理

IT プロフェッショナルは、サイト設定ページを使用して、SharePoint Server 2010 のエンタープライズ検索機能の一部をサイト コレクション レベルで管理することができます。また、IT プロフェッショナルは、SharePoint サーバーの全体管理サイトを使用して、他の一部のエンタープライズ検索機能を Search Service アプリケーション レベルで管理することができます。検索の管理の詳細について説明する前に、検索アーキテクチャの主要な概念とトポロジを理解することが重要です。

検索アーキテクチャ

図 8 は、SharePoint Server 2010 のエンタープライズ検索コンポーネントの論理アーキテクチャの概要を示しています。

図 8. 論理的な検索アーキテクチャ

図 8 が示すように、SharePoint Server 2010 のエンタープライズ検索機能を提供する 4 つの主なコンポーネントがあります。この 4 つを以下に示します。

· クローラー: このコンポーネントは、コンテンツ ソースと通信することができるコネクタを呼び出します。SharePoint Server 2010 はさまざまな種類のコンテンツ ソース (SharePoint サイト、他の Web サイト、ファイル共有、Lotus Notes データベース、Business Connectivity Services によって公開されるデータなど) をクロールできるので、特定のコネクタを使用して、それぞれの種類のソースとの通信が行われます。次に、クローラーは、コネクタを使用して、管理者が定義できるクロール ルールに基づいて、コンテンツ ソースに接続し、コンテンツ ソースをスキャンします。たとえば、クローラーは、ファイル コネクタを使用して、FILE:// プロトコルを使用してファイル共有に接続し、その後、ファイルのコンテンツとメタデータを取得するためにそのコンテンツ ソース内のフォルダー構造をスキャンします。同様に、クローラーは、Web コネクタを使用して、HTTP:// プロトコルまたは HTTPS:// プロトコルを使用して外部の Web サイトに接続し、その後、Web ページのコンテンツとメタデータを取得するために、ハイパーリンクをたどってそのコンテンツ ソース内の Web ページをスキャンします。コネクタは、特定の IFilter を読み込んで、ファイルに格納されている実際のデータを読み取ります。コネクタの詳細については、後の「コネクタ フレームワーク」セクションを参照してください。

· インデックス作成エンジン: このコンポーネントは、クローラーからデータのストリームを受け取り、その情報をファイル ベースの物理的なインデックスにどのように格納するかを決定します。たとえば、インデクサーは、既にインデックスが付けられた単語の記憶域要件を最適化し、特定の状況でのワード ブレークやステミングを管理し、ノイズ ワードを取り除き、複数のクエリ サーバーやパーティション分割されたインデックスがある場合に特定のインデックス パーティションにデータをどのように格納するかを決定します。インデックス作成エンジンは、クローラーおよびそのコネクタと連携して、複数のシステムのエンタープライズ データにインデックスを付けられるようにするというビジネス要件を満たします。このようなデータには、SharePoint サイトやファイル共有内のファイルに格納されている共用データ、およびカスタム ビジネス ソリューション (CRM データベース、ERP ソリューションなど) 内のデータが含まれます。

· クエリ エンジン: インデックス作成エンジンによって生成された、インデックスが付けられたデータは、SharePoint ファーム内のクエリ サーバーに伝達され、クエリ サーバーで 1 つ以上のインデックス ファイルに格納されます。このプロセスは "継続的な伝達" と呼ばれます。つまり、クロール プロセス中に、インデックスが付けられたデータが生成または更新されている間に、こうした変更はクエリ サーバーに伝達され、クエリ サーバーでインデックス ファイルに適用されるということです。このようにして、クエリ サーバー上のインデックス内のデータの待ち時間は非常に短時間となります。基本的に、新しいデータにインデックスが付けられると (または、インデックス内の既存のデータが更新されると)、こうした変更はたったの数秒以内にクエリ サーバー上のインデックス ファイルに適用されます。"クエリ サーバー" の役割を果たすサーバーは、保持しているインデックス ファイルを検索することによってユーザーからの検索に応答するので、待ち時間が最小限に抑えられることが重要です。SharePoint Server 2010 では、自動的に待ち時間が最小限に抑えられます。クエリ サーバーは、クエリ オブジェクト モデルを通じて受信したクエリを受けて、インデックスから結果を取得する役割を担います。クエリ サーバーは、クエリ オブジェクト モデルによって提供された検索語句に対して、ワード ブレーク、ノイズ ワードの除去、およびステミング (ステミングが有効になっている場合) を行う役割も担います。

· ユーザー インターフェイスとクエリ オブジェクト モデル: 前述のように、検索はクエリ オブジェクト モデルによって構成され、クエリ サーバーに発行されます。これは通常、ユーザーが SharePoint サイトのユーザー インターフェイスから実行した検索を受けて行われますが、(SharePoint Server 2010 の内部または外部でホストされた) カスタム ソリューションからの検索を受けて行われる場合もあります。また、検索は、カスタム コード (ワークフローやカスタム ナビゲーション コンポーネントなど) によって発行されたものである場合もあります。いずれにしろ、クエリ オブジェクト モデルによって検索語句が解析され、SharePoint ファーム内のクエリ サーバーにクエリが発行されます。クエリ サーバーからクエリ オブジェクト モデルにクエリの結果が返され、クエリ オブジェクト モデルはこの結果をユーザー インターフェイス コンポーネント (または、クエリを発行した他のコンポーネント) に提供します。

スケーラビリティと可用性

SharePoint Server 2010 では、クローラー コンポーネント、インデックス付けコンポーネント、およびクエリ コンポーネントのそれぞれのインスタンスを複数追加することができます。このレベルの柔軟性があるということは、SharePoint ファームをスケール変更できるということです (以前のバージョンの SharePoint Server では、インデックス付けコンポーネントをスケール変更することはできませんでした)。

SharePoint Server 2010 のエンタープライズ検索機能の目標は、ファームのサイズにかかわらずすべてのクエリでクエリの待ち時間が 1 秒未満になるようにすること、および以前のバージョンの SharePoint Server に存在したボトルネックを解消することです。スケールアウトされたアーキテクチャを実装することによってこれらの目標を実現することができます。SharePoint Server 2010 では、以前のバージョンと違って、検索アーキテクチャ内のすべての論理コンポーネントをスケールアウトすることができます。

コンポーネント化とスケール変更

図 9 は、検索のコンポーネント化、およびファーム内の各コンポーネントをスケールアウトできることを示しています。

図 9. クエリ サーバーとインデックスのスケールアウトされたアーキテクチャ

図 9 が示すように、可用性を提供したり、スケール変更して高いインデックス作成処理パフォーマンスを実現したりするために、複数のインデクサーをファームに追加することができます。各インデクサーが別々のコンテンツ ソース セットをクロールすることができるので、すべてのインデクサーがすべてのコンテンツ ソースにインデックスを付ける必要はありません。これは SharePoint Server 2010 の新機能です。さらに、インデクサーはインデックスの完全なコピーを格納せず、単にコンテンツ ソースをクロールしてクエリ サーバーにインデックスを伝達するだけになりました。

可用性を提供したり、スケール変更して高いクエリ パフォーマンスを実現したりするために、複数のクエリ サーバーを追加することもできます (図 9 参照)。複数のクエリ サーバーを追加すると、インデックスのパーティション分割を実装していることになります。各クエリ サーバーは論理インデックス全体のサブセットを保持するので、各クエリ サーバーがすべてのクエリに対してインデックス全体 (非常にサイズの大きなファイルになる可能性があります) を照会する必要はありません。パーティションは SharePoint Server 2010 によって自動的に保持されます。SharePoint Server 2010 は、クロールされた各ドキュメントの ID のハッシュを使用して、あるドキュメントがどのパーティションに属するかを判断します。その後、インデックスが付けられたデータは適切なクエリ サーバーに伝達されます。

もう 1 つの新機能は、管理プロパティとセキュリティ記述子の取得が Microsoft Office SharePoint Server 2007 よりもはるかに効率的になるように、プロパティ データベースもクエリ サーバーに伝達されるというものです。

高い可用性と復元力

各検索コンポーネントは、ミラーリングをサポートすることにより、高可用性要件も満たします。図 10 は、スケールアウトされミラー化されたアーキテクチャを示しています。

図 10. スケール変更されミラー化されたアーキテクチャ

コネクタ フレームワーク

SharePoint Server 2010 は、コンテンツ ソースへの接続とコンテンツ ソースのクロールを行うための新しいフレームワークを提供します。SharePoint Server 2010 では、SharePoint サイト、Web サイト、ファイル共有、(Business Connectivity Services を使用した) カスタムのデータベースと Web サービス、Exchange パブリック フォルダー、および Lotus Notes データベースのためのコネクタが提供されます。

新しいコネクタ機能

コネクタ フレームワークは、以前のバージョンの SharePoint Server のプロトコル ハンドラーと比べて機能が強化されています。たとえば、コネクタは、電子メール メッセージの本文だけでなく添付ファイルもクロールできるようになりました。また、Business Connectivity Services によって公開される外部データの、項目レベルのセキュリティ記述子を取得できるようになりました。さらに、Business Connectivity Services エンティティをクロールする際は、そのエンティティのエンティティ関係を通じて追加のエンティティをクロールすることができます。インライン キャッシュやバッチ処理などの概念の実装により、コネクタはパフォーマンスも以前のバージョンのプロトコル ハンドラーと比べて向上しています。

コネクタは、以前のバージョンの SharePoint Server のプロトコル ハンドラーよりも充実したクロール オプションをサポートしています。たとえば、以前のバージョンで実装されていたフル クロール モード、およびタイムスタンプ ベースの増分クロールをサポートしているだけでなく、最後のクロール以降に削除された項目を取り除くことができる、変更ログのクロールもサポートしています。

コネクタの作成

以前のバージョンの SharePoint Server では、新たな種類の外部システム用のプロトコル ハンドラーを作成するのは非常に困難でした。プロトコル ハンドラーはアンマネージ C++ コード内にコーディングされる必要があり、通常、プロトコル ハンドラーをテストし安定させるには長い時間がかかりました。

SharePoint Server 2010 では、外部システムをクロールするためのオプションがはるかに多くなっています。次のような選択肢が提供されます。

· SharePoint Designer 2010 を使用してデータベースや Web サービス用の外部のコンテンツ タイプとエンティティを作成し、こうしたエンティティを単純にクロールします。

· Visual Studio 2010 を使用してデータベースや Web サービス用の外部のコンテンツ タイプとエンティティを作成し、こうしたエンティティを単純にクロールします。

· (通常、ドキュメント管理システムなどの、動的データ モデルを実装するバックエンド システム用に) Visual Studio 2010 を使用して Business Connectivity Services 用の .NET 型 を作成します。その後、SharePoint Designer 2010 または Visual Studio 2010 を使用して、.NET 型用の外部のコンテンツ タイプとエンティティを作成します。

注: 必要であれば、(以前のバージョンの SharePoint Server のように) プロトコル ハンドラーを作成することもできます。

検索管理者向けのチュートリアル

SharePoint Server 2010 が提供するエンタープライズ検索機能は、サイト コレクション レベルおよび Search Service アプリケーション レベルで管理することができます。以下のセクションでは、SharePoint Server 2010 のエンタープライズ検索のさまざまな側面を処理するための順を追った説明を提供します。

Search Service アプリケーション レベルでの検索管理

管理者は、Search サービスの管理ページを使用して、検索サービスを使用するすべての Web アプリケーションに影響を与える検索設定を管理することができます。管理者は通常、検索システムを構成する場合はここから作業を開始します。主な日常的操作には、クロールするコンテンツ ソースの作成、クローラー設定の構成、こうしたコンテンツ ソースの関連性を向上させるための設定の構成、フェデレーション コンテンツ ソースの追加、および検索レポートの操作が含まれます。以下の手順リストでは、これらのシナリオすべての一般的な操作を実行するための説明を提供します。

クローラー設定

次の順を追った説明は、クローラー設定の操作を開始するのに役立ちます。

コンテンツ ソースを作成する

1. [スタート] ボタンをクリックし、[すべてのプログラム]、[Microsoft SharePoint 2010 Products] (Microsoft SharePoint 2010 製品) の順にポイントし、[SharePoint 2010 Central Administration] (SharePoint 2010 サーバーの全体管理) をクリックします。

2. [Application Management] (アプリケーション構成の管理) セクションで、[Manage service applications] (サービス アプリケーションの管理) をクリックします。

3. [Search Service Application] (Search Service アプリケーション) をクリックします。

4. サイド リンク バーの [Crawling] (クロール) セクションにある [Content Sources] (コンテンツ ソース) をクリックします。

5. [New Content Source] (新しいコンテンツ ソース) をクリックします。

6. このページの設定をすべて確認します。お使いの環境用にさまざまな種類のコンテンツ ソースを追加してみます。

人の検索を構成する

既定では、SharePoint Server 2010 は、ローカル SharePoint サイトのコンテンツ ソースをクロールする際、ユーザー プロファイルの詳細も自動的に対象に含めます。インデックスが付けられたこのユーザー プロファイル データは、SharePoint Server 2010 における人の検索の基盤を提供します。ただし、人の検索によって役に立つ情報が提供されるようにするには、ユーザー プロファイルをインポートまたは作成する必要があります。ユーザー プロファイルの処理に関するガイダンス、および SharePoint Server 2010 に他のインストール後の構成変更を加える方法については、「Post-installation steps for search (SharePoint Server 2010)」(英語) を参照してください。

クロール ルールを作成する

1. [スタート] ボタンをクリックし、[すべてのプログラム]、[Microsoft SharePoint 2010 Products] (Microsoft SharePoint 2010 製品) の順にポイントし、[SharePoint 2010 Central Administration] (SharePoint 2010 サーバーの全体管理) をクリックします。

2. [Application Management] (アプリケーション構成の管理) セクションで、[Manage service applications] (サービス アプリケーションの管理) をクリックします。

3. [Search Service Application] (Search Service アプリケーション) をクリックします。

4. サイド リンク バーの [Crawling] (クロール) セクションにある [Crawl Rules] (クロール ルール) をクリックします。

5. [New Crawl Rule] (新しいクロール ルール) をクリックします。

6. このページの設定をすべて確認します。お使いの環境用にさまざまなクロール ルールを追加してみます。