Upload
fuyuko-matsumura
View
473
Download
2
Embed Size (px)
Citation preview
LODAC Museum: Linked Open Dataによる博物館情報の統合と活用
松村 冬子1 嘉村 哲郎2,3 加藤 文彦4 小林 巌生5高橋 徹6 上田 洋6 大向 一輝1,2 武田 英明1,2
1国立情報学研究所 2総合研究大学院大学 3東京藝術大学 4情報・システム研究機構 5Open Community Data Initiative 6株式会社ATR-Promotions
2012年6月14日
はじめにオープンガバメント:Web上で政府や自治体の持つ情報を公開する動き‣ 海外
- 政府:data.gov(アメリカ),data.gov.uk(イギリス)- その他:図書館情報,博物館情報など
‣ 日本- 政府:オープンガバメントラボ(経済産業省),e-Stat(総務省)- その他:図書館情報,博物館情報,地域情報など
Linked Open Data (LOD):個々のデータを意味を持たせたリンクでつなぎ データ全体を表現する機械処理しやすい形式
アプリケーションなどでの利用が容易に
はじめにオープンガバメント:Web上で政府や自治体の持つ情報を公開する動き‣ 海外
- 政府:data.gov(アメリカ),data.gov.uk(イギリス)- その他:図書館情報,博物館情報など
‣ 日本- 政府:オープンガバメントラボ(経済産業省),e-Stat(総務省)- その他:図書館情報,博物館情報,地域情報など
Linked Open Data (LOD):個々のデータを意味を持たせたリンクでつなぎ データ全体を表現する機械処理しやすい形式
アプリケーションなどでの利用が容易に
多くがExcelや PDFなどで公開
LODによる 公開が拡大
LODAC Museum: 博物館情報のLODの構築と活用
本発表の内容
LODAC(LOD for ACademia) プロジェクト
‣ 学術リソースのためのオープンソーシャルセマンティックWeb基盤の構築(情報・システム研究機構 新領域融合センタープロジェクト)
‣ 活動- 国内の学術関連情報・公共情報をLODで公開・共有を促進- 学術,社会一般等,広範囲な情報資源共有のための情報流通基盤構築- 循環型情報活用基盤構築による分野・コミュニティへの貢献
• LODAC Museum: 博物館情報および地理情報のLOD化 • LODAC Species: 生物多様性情報のLOD化• LODAC BDLS: 生物学辞書のLOD化
http : / / lod .ac/
LODAC Museum
目的 ‣ 分散する博物館情報を統合的に生成・公開・共有・再利用できる環境の提供‣ 作品,作者,所蔵館などのリソースとその関係を一意に指し示せる仕組みの構築
情報源 ‣ 100機関以上の博物館Webサイトからスクレイピングしたコレクション情報 ‣ 日本美術シソーラス(統合基準データ)‣ 国指定文化財データベース‣ 文化遺産オンライン‣ 日本語版DBpedia Lite
SPARQLエンドポイント http : / / lod .ac/sparq l
<http://www.w3.org/2003/01/geo/wgs84_pos#lat
横浜トリエンナーレ
http://www.w3.org/2002/12/cal/icaltzd#location
の開催場所は横浜美術館
http://www.yaf.or.jp/rdfevent/event_00014520.rdf http://lod.ac/id/3172
主語 述語 目的語
35.45722主語 述語 目的語
緯度は
35.45722
LODAC Museumにおけるデータの統合情報源 Bの ID 統合 ID
dc:references dc:references
dc:references dc:references
dc:references dc:references
dc:creator dc:creator
crm:P55_has_current_location crm:P55_has_current_location
crm:P55_has_current_location dc:creator 情報源 Aの ID
作品
収蔵館
作者
参照元 材質・技法 サイズ・法量 収蔵経緯
例)作品の場合参照元
作品タイトル 英語タイトル 作品解説
参照先 タイプ 作者URI 所蔵館URI
主にリソースの内容を記述
主に他のリソースとの関係
を記述
統合情報 参照情報B参照情報A
情報源:博物館A 情報源:DBpedia
本年度の成果
LODAC Museum へのコレクション情報の増補 ‣ 15機関 53機関 114機関 達成!‣ Webサイトから収集した情報のRDF化を行うシステム‣ 標本情報の追加Semantic MediaWiki によるアノテーション‣ 作品情報に対するユーザのアノテーションLODAC Museumのデータを用いたアプリケーションの開発‣ Yokohama Art Spot‣ ふぉとぶらりPro‣ ミュージアムへ行こう!‣ DashSearch LD
本年度の成果
LODAC Museum へのコレクション情報の増補 ‣ 15機関 53機関 114機関 達成!‣ Webサイトから収集した情報のRDF化を行うシステム‣ 標本情報の追加Semantic MediaWiki によるアノテーション‣ 作品情報に対するユーザのアノテーションLODAC Museumのデータを用いたアプリケーションの開発‣ Yokohama Art Spot‣ ふぉとぶらりPro‣ ミュージアムへ行こう!‣ DashSearch LD
より多くの博物館からの新たなデータの統合
‣ 昨年
- トリプル数:13,035,604- 館数:15 機関
‣ 現在
- トリプル数: 40,059,131- 館数:53 機関 博物館Webサイトからのコレクション情報の追加 114 機関 サイエンスミュージアムネットからの 標本情報の追加(約169万件)
博物館Webサイトのコレクション情報の収集
変換
http://www.ima.or.jp/search/collection/index.php?app=shiryo&mode=detail&lang=ja&data_id=523
変換
博物館Webサイトのコレクション情報の収集
属性 属性値
プロパティ プロパティ値http://www.ima.or.jp/search/collection/index.php?app=shiryo&mode=detail&lang=ja&data_id=523
Webサイトから収集した情報のRDF化の効率化
属性 属性値
スクレイピング ( Apache Solr)
{ "institution": "iwate_art_museum", "segment": "20110516142455", "digest": "c9d1c62a480d8d80005a24583ec1fb12", "作品分類": "彫刻等[金属]", "tstamp": "20110516052459778", "作品名": "三人の妖精(さんにんのようせい)", "anchor": "004790001_sakuhin.html", "title": "岩手県立美術館 日本語版", "institutionalId": "004790001_sakuhin", ・・・ "技法/材質": "/ブロンズ/", "作家名": "アリスティード・マイヨール" }
属性・属性値(JSON)ルール考案
RDF生成<http://lod.ac/ref/821708> <http://lod.ac/ns/lodac#genre> "彫刻等[金属]" ; <http://purl.org/dc/elements/1.1/creator> "アリスティード・マイヨール"@ja ; <http://purl.org/dc/terms/created> "1937年" ; <http://purl.org/dc/terms/extent> "高さ158.0" ; <http://purl.org/dc/terms/isReferencedBy> <http://lod.ac/id/821708> ; <http://purl.org/dc/terms/medium> "/ブロンズ/"@ja ; <http://purl.org/dc/terms/rights> "岩手県立美術館" ; ・・・
RDF
subject: 自動生成したURI predicate:
属性にマッピングしたプロパティobject: 属性値
{ "meta": { "institutionalURI": "http://lod.ac/id/8144", "institutionalName": "岩手県立美術館", "dc:source": "http://www.ima.or.jp", "dc:rights": "岩手県立美術館" }, "rules": { "lodac:genre": [ { "name": "作品分類" } ], "dc:title": [ { "name": "作品名", "lang": "ja", ・・・ ], "dc:created": [ { "name": "制作年" } ], "dc11:creator": [ { "name": "作家名", "lang": "ja" } ], ...... }
マッピングルール(JSON)専門知識を有するユーザ
博物館Webサイト
コレクション全体のプロパティ
コレクションごとのマッピングルール
変換処理とマッピングルールの考案を分離
標本情報の追加
サイエンス ミュージアム ネット(S-Net) ‣ 自然史標本のデータ(学名,採集地,採集開始日,所蔵機関)を公開
LODACの持つ情報へのリンク
‣ 所蔵機関 博物館情報 in LODAC Museum 新たに61機関追加
‣ 学名 種情報 in LODAC Species
<h#p://lod.ac/ref/1780731> a lodac:SpecimenReference; rdfs:label "Papilio xuthus"; species:collecDonDate "1985年08月31日";
species:collecDonGround "日本 奈良県 橿原市 ";
species:insDtuDonName "橿原市昆虫館";
species:species <h#p://lod.ac/species/Papilio_xuthus>; crm:P55_has_current_locaDon <h#p://lod.ac/id/458869>; dc:hasFormat <h#p://lod.ac/ref/1780731.html>, ・・・
種情報の リンク
博物館情報の リンク
LODAC Museumへの標本情報の追加により期待
lodac:Specimen標本情報
URN:catalog:KCMI:KCMI:Lep001014
species:SpeciesName種情報
ミヤマカラスアゲハ
foaf:Organization博物館情報
橿原市昆虫館CC BY-NC 2.0 small-life.com
この昆虫館には他にどんな標本がある?
この蝶と同じ属にはどんな蝶がいる?
ナミアゲハ キアゲハ
生物多様性情報
博物館情報
CC BY 3.0 Bruce Marlin
本年度の成果
LODAC Museum へのコレクション情報の増補 ‣ 15機関 53機関 114機関 達成!‣ Webサイトから収集した情報のRDF化を行うシステム‣ 標本情報の追加Semantic MediaWiki によるアノテーション‣ 作品情報に対するユーザのアノテーションLODAC Museumのデータを用いたアプリケーションの開発‣ Yokohama Art Spot‣ ふぉとぶらりPro‣ ミュージアムへ行こう!‣ DashSearch LD
Semantic MediaWiki
LODAC上のデータhttp://lod.ac/id/4301
ユーザ
アノテーション
フォームで入力
SMW上で付与されたアノテーションをデータに反映
Semantic MediaWiki によるアノテーション
① 統合されたデータ
② 日本美術シソーラス
③ ユーザが持つ情報
仏像に関してはもっと詳しいデータが
書きたい!
① ② ③
本年度の成果
LODAC Museum へのコレクション情報の増補 ‣ 15機関 53機関 114機関 達成!‣ Webサイトから収集した情報のRDF化を行うシステム‣ 標本情報の追加Semantic MediaWiki によるアノテーション‣ 作品情報に対するユーザのアノテーションLODAC Museumのデータを用いたアプリケーションの開発‣ Yokohama Art Spot‣ ふぉとぶらりPro‣ ミュージアムへ行こう!‣ DashSearch LD
LODAC Museumを活用したアプリケーションの開発
Yokohama Art Spot ‣ Webアプリケーション‣ 3つのLODによる横浜のアート関連情報の提供
ふぉとぶらりPro ‣ iPod/iPhone アプリケーション(株式会社ATR-Promotionsより販売)‣ 写真閲覧時にLODの情報を付加的に表示
ミュージアムへ行こう! ‣ Twitter bot + Webアプリケーション‣ ユーザへのプッシュ型情報配信
DashSearch LD ‣ Webアプリケーション‣ LODを多面的にファセット検索できるインタフェース
LODAC Museumを活用したアプリケーションの開発
Yokohama Art Spot ‣ Webアプリケーション‣ 3つのLODによる横浜のアート関連情報の提供
ふぉとぶらりPro ‣ iPod/iPhone アプリケーション(株式会社ATR-Promotionsより販売)‣ 写真閲覧時にLODの情報を付加的に表示
ミュージアムへ行こう! ‣ Twitter bot + Webアプリケーション‣ ユーザへのプッシュ型情報配信
DashSearch LD ‣ Webアプリケーション‣ LODを多面的にファセット検索できるインタフェース
Yokohama Art Spot
‣ 博物館情報と横浜の地域情報のLODを連携したWebアプリケーション
‣ 横浜市内のアート関連情報- 施設情報- イベント情報- 収蔵品情報(一部の施設のみ)- Q&A情報
http : / / lod .ac/apps/yas/
LODAC Museum × ヨコハマ・アートLOD × PinQA博物館情報 スポット情地域情報
Yokohama Art Spot システム構成
作 品
所 蔵 館アーティスト
アーティスト 施 設
イベント
質 問
回 答ユーザ
SPARQL
スポット情報 イベント情報 施設情報
PinQA ヨコハマ・アートLOD LODAC
JSON SPARQL
JSONXML
SPARQL
ユーザ Yokohama Art Spot情報の取得 & 提示
‣異なるLODのリソース同士のリンク ‣緯度・経度の範囲
リンク
ミュージアムへ行こう!
ユーザのtweetに対する推薦‣ 発言に緯度・経度 / 地名が含まれていたら…
- ユーザの位置に最も近い博物館・美術館をLODAC Museumから検索
- 館の概要や経路をユーザに向けてreply
Webサイトにおける推薦‣ LODAC Museum,saveMLAK,Wikipediaから得られる情報を併せて表示
LODとTwitterを連携 ‣ ユーザに対するLODの情報のプッシュが実現
‣ TwitterにおけるユーザとのインタラクションによるLODへのアノテーションも期待
DashSearch for SPARQL
‣ LODを多面的に検索することが可能なインタフェース‣ メタデータウィジェットによりファセット検索を実現‣ 使用可能なSPARQLエンドポイント
- LODAC Museum- LODAC Species- LODAC BDLS- DBPedia- DBPedia Japanese
LODの持つプロパティやその値などから全体像の把握を支援
複数のLODを利用することにより期待される効果
単独のLODで利用するよりも幅広い情報提供ができる例)イベントが開催される博物館の情報にアクセス 所蔵品の情報を閲覧 「横尾忠則の作品あるんだ」
連携する複数のLODが互いに補完できる 横浜LODがイベントの情報を更新 LODAC Museumは新しい施設情報を追加登録
状況の変化に応じたアプリケーション変更のコストを抑えられる RDF,SPARQLなど標準化された形式や方法でデータをやり取り 新たに別のLODと連携させたい場合でも変更が少ない 例)同じSPARQLを流用することが可能な場合もある
ワンソース・マルチユースの促進
ユーザの新たな 発見を誘発
ヨコハマ・アートLOD
LODACMuseum
新しい情報
新しい情報
まとめと今後の課題
‣ LODAC Museum: 博物館情報のLOD化とその活用 ‣ 昨年からの成果
- LODAC Museum へのコレクション情報の増補• 新たに99機関からのコレクション情報の追加(総計114機関)• Webサイトから収集した情報のRDF化を効率化• 標本情報の追加
- Semantic MediaWiki による作品情報へのユーザのアノテーション- 4つのアプリケーションの開発
‣ 今後の課題 - DBpedia Japanese, Europeanaなどへのリンクの生成- コレクション情報の属性とプロパティのマッピングの効率化- Semantic MediaWikiによるアノテーション方法の改良- コレクション情報,専門用語などの新しい種類の情報の更なる追加