27
LODAC Museum: Linked Open Dataによる博物館情報の統合と活用 松村 冬子 1 嘉村 哲郎 2,3 加藤 文彦 4 小林 巌生 5 高橋 6 上田 6 大向 一輝 1,2 武田 英明 1,2 1 国立情報学研究所  2 総合研究大学院大学  3 東京藝術大学  4 情報・システム研究機構  5 Open Community Data Initiative 6 株式会社ATR-Promotions 2012614

LODAC Museum: Linked Open Dataによる博物館情報の統合と活用

Embed Size (px)

Citation preview

LODAC Museum:  Linked Open Dataによる博物館情報の統合と活用

松村 冬子1 嘉村 哲郎2,3 加藤 文彦4 小林 巌生5高橋 徹6 上田 洋6 大向 一輝1,2 武田 英明1,2

1国立情報学研究所  2総合研究大学院大学  3東京藝術大学 4情報・システム研究機構  5Open Community Data Initiative  6株式会社ATR-Promotions

2012年6月14日

はじめにオープンガバメント:Web上で政府や自治体の持つ情報を公開する動き‣ 海外

- 政府:data.gov(アメリカ),data.gov.uk(イギリス)- その他:図書館情報,博物館情報など

‣ 日本- 政府:オープンガバメントラボ(経済産業省),e-Stat(総務省)- その他:図書館情報,博物館情報,地域情報など

Linked Open Data (LOD):個々のデータを意味を持たせたリンクでつなぎ             データ全体を表現する機械処理しやすい形式

アプリケーションなどでの利用が容易に

はじめにオープンガバメント:Web上で政府や自治体の持つ情報を公開する動き‣ 海外

- 政府:data.gov(アメリカ),data.gov.uk(イギリス)- その他:図書館情報,博物館情報など

‣ 日本- 政府:オープンガバメントラボ(経済産業省),e-Stat(総務省)- その他:図書館情報,博物館情報,地域情報など

Linked Open Data (LOD):個々のデータを意味を持たせたリンクでつなぎ             データ全体を表現する機械処理しやすい形式

アプリケーションなどでの利用が容易に

多くがExcelや PDFなどで公開

LODによる 公開が拡大

LODAC Museum: 博物館情報のLODの構築と活用

本発表の内容

LODAC(LOD for ACademia) プロジェクト

‣ 学術リソースのためのオープンソーシャルセマンティックWeb基盤の構築(情報・システム研究機構 新領域融合センタープロジェクト)

‣ 活動- 国内の学術関連情報・公共情報をLODで公開・共有を促進- 学術,社会一般等,広範囲な情報資源共有のための情報流通基盤構築- 循環型情報活用基盤構築による分野・コミュニティへの貢献

• LODAC Museum: 博物館情報および地理情報のLOD化 • LODAC Species: 生物多様性情報のLOD化• LODAC BDLS: 生物学辞書のLOD化

http : / / lod .ac/

LODAC Museum

目的 ‣ 分散する博物館情報を統合的に生成・公開・共有・再利用できる環境の提供‣ 作品,作者,所蔵館などのリソースとその関係を一意に指し示せる仕組みの構築

情報源 ‣ 100機関以上の博物館Webサイトからスクレイピングしたコレクション情報 ‣ 日本美術シソーラス(統合基準データ)‣ 国指定文化財データベース‣ 文化遺産オンライン‣ 日本語版DBpedia Lite

SPARQLエンドポイント http : / / lod .ac/sparq l

<http://www.w3.org/2003/01/geo/wgs84_pos#lat

横浜トリエンナーレ

http://www.w3.org/2002/12/cal/icaltzd#location

の開催場所は横浜美術館

http://www.yaf.or.jp/rdfevent/event_00014520.rdf http://lod.ac/id/3172

主語 述語 目的語

35.45722主語 述語 目的語

緯度は

35.45722

LODAC Museumにおけるデータの統合情報源 Bの ID 統合 ID

dc:references dc:references

dc:references dc:references

dc:references dc:references

dc:creator dc:creator

crm:P55_has_current_location crm:P55_has_current_location

crm:P55_has_current_location dc:creator 情報源 Aの ID

作品

収蔵館

作者

参照元 材質・技法 サイズ・法量 収蔵経緯

例)作品の場合参照元

作品タイトル 英語タイトル 作品解説

参照先 タイプ 作者URI 所蔵館URI

主にリソースの内容を記述

主に他のリソースとの関係

を記述

統合情報 参照情報B参照情報A

情報源:博物館A 情報源:DBpedia

博物館情報のLOD化により期待される世界

作者

Q:日本国内で葛飾北斎 の作品はどこにある?

lod.ac

所蔵館作品

博物館情報のLOD化により期待される世界

作品所蔵館

作者

Q:日本国内で葛飾北斎 の作品はどこにある?

世界中

owl:sameAs

作者

所蔵館作品

euroepeana.eu

lod.ac

本年度の成果

LODAC Museum へのコレクション情報の増補 ‣ 15機関   53機関   114機関 達成!‣ Webサイトから収集した情報のRDF化を行うシステム‣ 標本情報の追加Semantic MediaWiki によるアノテーション‣ 作品情報に対するユーザのアノテーションLODAC Museumのデータを用いたアプリケーションの開発‣ Yokohama Art Spot‣ ふぉとぶらりPro‣ ミュージアムへ行こう!‣ DashSearch LD

本年度の成果

LODAC Museum へのコレクション情報の増補 ‣ 15機関   53機関   114機関 達成!‣ Webサイトから収集した情報のRDF化を行うシステム‣ 標本情報の追加Semantic MediaWiki によるアノテーション‣ 作品情報に対するユーザのアノテーションLODAC Museumのデータを用いたアプリケーションの開発‣ Yokohama Art Spot‣ ふぉとぶらりPro‣ ミュージアムへ行こう!‣ DashSearch LD

より多くの博物館からの新たなデータの統合

‣ 昨年

- トリプル数:13,035,604- 館数:15 機関

‣ 現在

- トリプル数: 40,059,131- 館数:53 機関  博物館Webサイトからのコレクション情報の追加      114 機関 サイエンスミュージアムネットからの         標本情報の追加(約169万件)

博物館Webサイトのコレクション情報の収集

変換

http://www.ima.or.jp/search/collection/index.php?app=shiryo&mode=detail&lang=ja&data_id=523

変換

博物館Webサイトのコレクション情報の収集

属性 属性値

プロパティ プロパティ値http://www.ima.or.jp/search/collection/index.php?app=shiryo&mode=detail&lang=ja&data_id=523

Webサイトから収集した情報のRDF化の効率化

属性 属性値

スクレイピング ( Apache Solr)

{ "institution": "iwate_art_museum", "segment": "20110516142455", "digest": "c9d1c62a480d8d80005a24583ec1fb12", "作品分類": "彫刻等[金属]", "tstamp": "20110516052459778", "作品名": "三人の妖精(さんにんのようせい)", "anchor": "004790001_sakuhin.html", "title": "岩手県立美術館 日本語版", "institutionalId": "004790001_sakuhin",      ・・・ "技法/材質": "/ブロンズ/", "作家名": "アリスティード・マイヨール" }

属性・属性値(JSON)ルール考案

RDF生成<http://lod.ac/ref/821708> <http://lod.ac/ns/lodac#genre> "彫刻等[金属]" ; <http://purl.org/dc/elements/1.1/creator> "アリスティード・マイヨール"@ja ; <http://purl.org/dc/terms/created> "1937年" ; <http://purl.org/dc/terms/extent> "高さ158.0" ; <http://purl.org/dc/terms/isReferencedBy> <http://lod.ac/id/821708> ; <http://purl.org/dc/terms/medium> "/ブロンズ/"@ja ; <http://purl.org/dc/terms/rights> "岩手県立美術館" ;    ・・・

RDF

subject: 自動生成したURI predicate:

属性にマッピングしたプロパティobject: 属性値

{ "meta": { "institutionalURI": "http://lod.ac/id/8144", "institutionalName": "岩手県立美術館", "dc:source": "http://www.ima.or.jp", "dc:rights": "岩手県立美術館" }, "rules": { "lodac:genre": [ { "name": "作品分類" } ], "dc:title": [ { "name": "作品名", "lang": "ja", ・・・ ], "dc:created": [ { "name": "制作年" } ], "dc11:creator": [ { "name": "作家名", "lang": "ja" } ], ...... }

マッピングルール(JSON)専門知識を有するユーザ

博物館Webサイト

コレクション全体のプロパティ

コレクションごとのマッピングルール

変換処理とマッピングルールの考案を分離

標本情報の追加

サイエンス ミュージアム ネット(S-Net) ‣ 自然史標本のデータ(学名,採集地,採集開始日,所蔵機関)を公開

LODACの持つ情報へのリンク

‣ 所蔵機関   博物館情報 in LODAC Museum   新たに61機関追加

‣ 学名      種情報 in LODAC Species

<h#p://lod.ac/ref/1780731>  a  lodac:SpecimenReference;        rdfs:label  "Papilio  xuthus";        species:collecDonDate  "1985年08月31日";  

     species:collecDonGround  "日本  奈良県  橿原市  ";  

     species:insDtuDonName  "橿原市昆虫館";  

     species:species  <h#p://lod.ac/species/Papilio_xuthus>;        crm:P55_has_current_locaDon  <h#p://lod.ac/id/458869>;        dc:hasFormat  <h#p://lod.ac/ref/1780731.html>,   ・・・

種情報の リンク

博物館情報の リンク

LODAC Museumへの標本情報の追加により期待

lodac:Specimen標本情報

URN:catalog:KCMI:KCMI:Lep001014

species:SpeciesName種情報

ミヤマカラスアゲハ

foaf:Organization博物館情報

橿原市昆虫館CC BY-NC 2.0 small-life.com

この昆虫館には他にどんな標本がある?

この蝶と同じ属にはどんな蝶がいる?

ナミアゲハ キアゲハ

生物多様性情報

博物館情報

CC BY 3.0 Bruce Marlin

本年度の成果

LODAC Museum へのコレクション情報の増補 ‣ 15機関   53機関   114機関 達成!‣ Webサイトから収集した情報のRDF化を行うシステム‣ 標本情報の追加Semantic MediaWiki によるアノテーション‣ 作品情報に対するユーザのアノテーションLODAC Museumのデータを用いたアプリケーションの開発‣ Yokohama Art Spot‣ ふぉとぶらりPro‣ ミュージアムへ行こう!‣ DashSearch LD

Semantic MediaWiki

LODAC上のデータhttp://lod.ac/id/4301

ユーザ

アノテーション

フォームで入力

SMW上で付与されたアノテーションをデータに反映

Semantic MediaWiki によるアノテーション

① 統合されたデータ

② 日本美術シソーラス

③ ユーザが持つ情報

仏像に関してはもっと詳しいデータが

書きたい!

① ② ③

本年度の成果

LODAC Museum へのコレクション情報の増補 ‣ 15機関   53機関   114機関 達成!‣ Webサイトから収集した情報のRDF化を行うシステム‣ 標本情報の追加Semantic MediaWiki によるアノテーション‣ 作品情報に対するユーザのアノテーションLODAC Museumのデータを用いたアプリケーションの開発‣ Yokohama Art Spot‣ ふぉとぶらりPro‣ ミュージアムへ行こう!‣ DashSearch LD

LODAC Museumを活用したアプリケーションの開発

Yokohama Art Spot ‣ Webアプリケーション‣ 3つのLODによる横浜のアート関連情報の提供

ふぉとぶらりPro ‣ iPod/iPhone アプリケーション(株式会社ATR-Promotionsより販売)‣ 写真閲覧時にLODの情報を付加的に表示

ミュージアムへ行こう! ‣ Twitter bot + Webアプリケーション‣ ユーザへのプッシュ型情報配信

DashSearch LD ‣ Webアプリケーション‣ LODを多面的にファセット検索できるインタフェース

LODAC Museumを活用したアプリケーションの開発

Yokohama Art Spot ‣ Webアプリケーション‣ 3つのLODによる横浜のアート関連情報の提供

ふぉとぶらりPro ‣ iPod/iPhone アプリケーション(株式会社ATR-Promotionsより販売)‣ 写真閲覧時にLODの情報を付加的に表示

ミュージアムへ行こう! ‣ Twitter bot + Webアプリケーション‣ ユーザへのプッシュ型情報配信

DashSearch LD ‣ Webアプリケーション‣ LODを多面的にファセット検索できるインタフェース

Yokohama Art Spot

‣ 博物館情報と横浜の地域情報のLODを連携したWebアプリケーション

‣ 横浜市内のアート関連情報- 施設情報- イベント情報- 収蔵品情報(一部の施設のみ)- Q&A情報

http : / / lod .ac/apps/yas/

LODAC Museum × ヨコハマ・アートLOD × PinQA博物館情報 スポット情地域情報

Yokohama Art Spot システム構成

作 品

所 蔵 館アーティスト

アーティスト 施 設

イベント

質 問

回 答ユーザ

SPARQL

スポット情報 イベント情報 施設情報

PinQA ヨコハマ・アートLOD LODAC

JSON SPARQL

JSONXML

SPARQL

ユーザ Yokohama Art Spot情報の取得 & 提示

‣異なるLODのリソース同士のリンク ‣緯度・経度の範囲

リンク

ミュージアムへ行こう!

ユーザのtweetに対する推薦‣ 発言に緯度・経度 / 地名が含まれていたら…

- ユーザの位置に最も近い博物館・美術館をLODAC Museumから検索

- 館の概要や経路をユーザに向けてreply

Webサイトにおける推薦‣ LODAC Museum,saveMLAK,Wikipediaから得られる情報を併せて表示

LODとTwitterを連携 ‣ ユーザに対するLODの情報のプッシュが実現

‣ TwitterにおけるユーザとのインタラクションによるLODへのアノテーションも期待

DashSearch for SPARQL

‣ LODを多面的に検索することが可能なインタフェース‣ メタデータウィジェットによりファセット検索を実現‣ 使用可能なSPARQLエンドポイント

- LODAC Museum- LODAC Species- LODAC BDLS- DBPedia- DBPedia Japanese

LODの持つプロパティやその値などから全体像の把握を支援

複数のLODを利用することにより期待される効果

単独のLODで利用するよりも幅広い情報提供ができる例)イベントが開催される博物館の情報にアクセス    所蔵品の情報を閲覧   「横尾忠則の作品あるんだ」

連携する複数のLODが互いに補完できる 横浜LODがイベントの情報を更新    LODAC Museumは新しい施設情報を追加登録

状況の変化に応じたアプリケーション変更のコストを抑えられる RDF,SPARQLなど標準化された形式や方法でデータをやり取り    新たに別のLODと連携させたい場合でも変更が少ない    例)同じSPARQLを流用することが可能な場合もある

ワンソース・マルチユースの促進

ユーザの新たな 発見を誘発

ヨコハマ・アートLOD

LODACMuseum

新しい情報

新しい情報

まとめと今後の課題

‣ LODAC Museum: 博物館情報のLOD化とその活用 ‣ 昨年からの成果

- LODAC Museum へのコレクション情報の増補• 新たに99機関からのコレクション情報の追加(総計114機関)• Webサイトから収集した情報のRDF化を効率化• 標本情報の追加

- Semantic MediaWiki による作品情報へのユーザのアノテーション- 4つのアプリケーションの開発

‣ 今後の課題 - DBpedia Japanese, Europeanaなどへのリンクの生成- コレクション情報の属性とプロパティのマッピングの効率化- Semantic MediaWikiによるアノテーション方法の改良- コレクション情報,専門用語などの新しい種類の情報の更なる追加