Upload
others
View
14
Download
0
Embed Size (px)
Citation preview
1
1
1
XML ConsortiumXML Consortium
© XML Consortium
Webサービス、Web2.0、XMLDBによる
フューチャWebサイト構想プロジェクト
XMLDB部会リーダー加藤哲義(ジャストシステム)
2
1. プロジェクトの発足経緯と目的2. 文書コンテンツのXML化について3. XMLDBアクセスのための共通インターフェース
- REST- JDBC
4. XMLDB的、今後への展望
XMLDB部会の発表パート
2
3
発表者
「プロジェクトの発足経緯と目的」「文書コンテンツのXML化について」加藤哲義(ジャストシステム)
「XMLDBアクセスのための共通インターフェースについて」山口洋一(サイバーテック)中林紀彦(日本アイ・ビー・エム)飯島岐勇(日立製作所)
「XMLDB的、今後への展望」矢野令(東芝ソリューション)
4
1. プロジェクトの発足経緯と目的
3
5
経緯
1.XMLDB部内でXMLDBの実開発を通して、そのメリットや開発心得、システム観を培うことを目的に、
2.当初テーマは 「XMLDBを使って、XMLDB事例検索サイトを構築してみましょうよ (穴沢サブリーダ)」だった。
XMLコンソーシアムに蓄積されているセミナー資料が探し出せない
3.ならば「XMLコンソーシアムサイトのリニューアル」をお題にコンテンツ検索でのXMLDBの利用シーンとメリットを構想してみよう。
6
経緯
4.どうせなら、Webの最新技術を取り込んでは、ということで、村垣さん→Webサービス実証部会川口さん→Web2.0部会に、お声掛けいただく。
5.各部会、ご賛同いただき、3部会合同のプロジェクトに拡大される。
4
7
MODELMODELXML DB
XML DB
XML DB
独自
CONTROLCONTROLVIEWVIEW
既存資産
WebWebサーバサーバ
移行
検索
AjaxAjax
他のWebサービス
連携
Webサービス Webサービス
連携
追加
更新
削除
Flex/AIRFlex/AIRxfyxfy
XHTMLXHTML
マッシュアップマッシュアップツールツール
WebOSWebOS
登録連携
取得
複数種類のXML DBを互換性検証のため併用
7
サーバーサイド /クライアンドマッシュアップ
同一機能/複数タイプのWebAPIを評価
RE
STJD
BC
ビジネス・ロジック
共通X
ML
ドライバ
共通X
ML
ドライバ
DBアクセス
SliverlightSliverlight
全体モデル XML勧告10周年イベント「XMLトピック解説(2)」57ページ(松山憲和氏パート)より引用
8
目的
企業、団体のWebサイトをリニューアルさせる際、XMLDB、Web2.0、Webサービス等の最新技術を利用することで
実現できる開発方式、新機能、利用形態、付加価値を、
各部会の専門性を集積したプロト開発を通じて模索し、
次世代Webサイトのフューチャを世に示唆する。
本プロジェクトではその例題として、
身近なXMLコンソーシアムサイトを対象とする。
5
9
XMLDB部会の役割分担
① コンソーシアム・コンテンツのXML化今回はコンソーシアムサイトに掲載されている、部会成果資料(pdf)を
XML化して、XMLDBに格納する。
そのための、
・XML化の手法・XMLスキーマのベース策定
を担当する。
三層モデル中のMODEL層を担う。
10
XMLDB部会の役割分担
② XML製品非依存のAPIの策定と実装
XQuery対応レベルや更新APIのシンタックス、JDBCへの対応度合など、XMLDB製品各様である。
したがって、これらの差違を開発者が意識しなくてすむような
共通インターフェースをXMLDB部会で策定し、実装して公開する。
・ネイティブXMLDBはREST
・ハイブリッドDBはJDBCドライバ
6
11
XMLDB部会の役割分担
③ XMLDB製品の貸し出しとサポート
東芝ソリューション、サイバーテック、日本IBM、日立製作所が本プロジェクトに参加。
製品提供と他部会開発者へのサポートを実施。
12
XMLDB
XMLBody部
テキスト
抽出
属性検索・全文検索
ユーザによるコンテンツへの
検索用タグ付け→構造変化
メタ情報付与
マッシュアップ
カスタマイズ
文書XML
② XMLDB製品非依存の共通インターフェース策定
① コンソーシアム文書(pdf)のXML化
ジャストシステムのXML簡易変換ツール
xfyエディタ編集
Webサービス実証部会Web2.0部会
7
13
2. 文書コンテンツのXML化について
14
XMLDB部会の狙い
XMLコンソーシアムのコンテンツのXML化において、段階的にデータ構造の細粒化、最適化を行うために
XMLDBの柔軟性、寛容性が有効であることの実証。
つまり、最初は最低限の要素でXML化し、
メタ情報への属性検索とボディ部の全文検索によって
ヒットしたコンテンツに対し、気付きを得たユーザ自身が
より効果的な検索や活用をするために
メタ要素の付与や本文へのタギングを行うことで
最適なXMLを育ていくモデル。
8
15
文書XML = メタ情報XML + 本文XML
固定メタ情報
拡張メタ情報 ページ本文
ページ見出し
xfy Clientやエディタで編集 自動XMLフィルターで文書から自動変換
xfy Clientで合体XMLDBで管理
文書XMLをどのように構成し、どうやって作成するか。
Dublin Coreベース
16
XML化フィルター
PDFファイル各ページコンテンツを自動XML化body/pageのインスタンスとなる。これを本文XMLとする。
PDFからXMLへの変換手順①
今回、ボディ内容はXMLDBの全文検索の対象にするため、ページ粒度のXMLとした。なお自動フィルタは、Word, ppt, xlsには、さらにきめ細かい粒度のXML化が可能。
9
17
大容量データに対するDB機能の新三要素高速検索RDB ファイルインデキシング型 XMLDB データ構造を固定した上で挿入更新データ構造の(トランザクション)自由度(スキーマレス) X M L C o n s o r t i u m DBMS型 XMLDB c XMLConsortium
ジャストシステムの簡易XMLフィルター
18
XMLDBの適用領域として適するもの (複数回答可)その他文書管理 22% 23% 部品管理医療情報 14% 16% 傷害情報設計情報 5% 管理 9% 商品管理X M L C o n s o r t i u m 11% © XMLConsortium
エクセルなどの
データを組み込んで
作った図表も抽出
ジャストシステムの簡易XMLフィルター
10
19
20
加藤さん、Cc:関係各位、インタフェースXML仕様(Week向け暫定版ですね)の fix前、ぎりぎりのこのタイミングで、4/18のWeb2.0部会で、標記の観点でアイディアが出て、シンタックス、セマンティクス両面で大きく進展してしまいました。きっかけは、「どうせ(似たような5W1Hのメタデータ表現で大差ない)ならRSSを使って欲しい」という、リッチクライアント部会さんからの前回3/28の要請でした。4/24から海外出張中につき4/25参加できず恐縮ですが、可能な限り、上流でも対応していただきたく、近く、提示させていただきます。
中略
今回、構造化の対象としている情報は、これまで、「文書」と主に考えてまいりました。文書メタデータの世界標準語彙、セマンティクスといえば、ダブリンコアだ!と4/18朝に思い出しました。これなら意味解釈の合意も早い、と:これ(4/18に配布)を見ると、属性の拡張も含めてかなり詳細に、文書メタデータを妥当に定義するための道具立てが揃って
いることがわかります。さすが、数百人の世界的研究者が10数年かけて練り上げた規格
です。
野村直之さんからのメール 2008.04.22 (無断転載)
見出し:I/F XML:もっと「構造化と標準化」を!;「文書とイベント」両セマンティクスが必要
11
21
ルート
メタ情報グループ
総ページ数(属性)文書IDタイトル発表したイベント名発表年月日著者グループ(複数可)
氏名所属団体
関連部会(複数可)本文書のパス代表図のパスキーワード(複数可)任意メタ情報グループ
項目グループ(複数可)項目内容
項目名(属性)Any要素下層項目グループ(複数可)
本文グループページ内容(複数可)
ページ番号(属性)
固定項目
任意項目
bodypage
no
文書XMLスキーマ・第1版
22
12
23インスタンスをそのまま組み込む。
PDFからXMLへの変換手順②
コンテンツ管理者が共通メタ情報を入力
コンテンツ閲覧者が任意にメタ情報を追加設定
メタデータ・エディタ(xfy利用)
24
コンテンツ管理者が共通のメタ情報を入力し固定メタ情報XMLを生成。
13
25
閲覧者がソーシャルタギングを任意に行う
閲覧者は、並列的な要素設定のみならず階層的にも要素設定を行うことができる。
拡張メタ要素は閲覧者達が任意の構造のXML要素を作り、皆で階層化する。
26
階層的に拡張され生成される、メタ要素。
出版社 ISBN
本体価格 消費税
著書
定価
14
27
メタデータ 第1版
28
コンソーシアム文書XMLスキーマ第1版
15
29
コンソーシアム文書XMLスキーマ第1版(続き)
30
コンソーシアム文書XMLスキーマ第1版(続き)
16
31
コンソーシアム文書XMLスキーマ第1版(続き)
32
コンソーシアム文書XMLスキーマ第1版(続き)
17
33
to:XMLDB部会の皆様
荒本@アドソル日進です、お世話になっております。
Weekの発表では、可能であればデモで、Web2.0部会のアプリ→Webサービス実証部会のサービス→XMLDBのDB or RESTサービス
という流れを動かそうとしています。
しかし、Web2.0部会のアプリは、metadataの部分を主に扱うので、デモ映えを良くしようと思うと、metadataを充実させる必要があります。
そこで、XMLコンソーシアムのサイトから、概要のテキストや、イベント会場など、PDFには含まれていなかった情報をXMLインスタンスに付加させてください。
荒本道隆さんからのメール 2008.05.30 (無断転載)
34
メタデータの拡張
18
35
第2版のインスタンス例
36
地理情報にgeorssが要る。
文書メタデータの語彙はDublin Coreがいい(第1版)
イベント・メタデータにxCalを使おう。
文書XML
他部会からのデータ構造拡張の我が儘な要求
スキーマ第1版リリース後、Webサービス実証部会からメタデータ拡張の要求が出る。さらに、今後も出てくるだろう。
XMLDB的には問題無し。好きにしてちょ。
19
37
1. XMLDBに格納する文書のXMLが、ODF or OOXMLでないのはなぜか?
2. REST APIは、Ruby on RailsのURI形式に合わせたらどうか?
3. メタデータ要素は現状、文書単位だが、ページ単位、あるいはドキュメント内の任意の場所に追加
する方法は?
本プロジェクト途上でのXMLDB部会内議論
38
4. ユーザが自由に追加する要素を、エレメント名にするメリットは?
ex. 拍手ぱらぱら
ぱらぱら
本プロジェクト途上でのXMLDB部会内議論
20
39
本プロジェクト途上でのXMLDB部会内議論
5. そもそも、共通REST APIを定義して、複数ベンダーのDBに対応する必要はあるのか?
たとえば、XMLDBはオープンソースのものを使用しXMLDB部会としてはスキーマ設計やユースケースの検討などに集中
すべきではないのか?
40
XMLDB部会加藤 哲義
(株式会社ジャストシステム)
お問合せ
※本書に記載されている商品名、会社名などの固有名詞は、各社の商標及び登録商標です。※本書の内容の一部またはすべてを、著者の事前の許可なく複製や再利用することを禁じます。
http://www.xfy.com/jp/[email protected]
お問い合わせ