22
DBpedia Japanese とと とととと [email protected] @takechan2000 とととととととと NPO とと とととと ととととと とととと ととととととと ・・・

DBpedia Japaneseとは?

Embed Size (px)

DESCRIPTION

Wikimedia Conference Japanでの発表資料です。 DBpeidiaとは何か?そもそもLInked Dataとは何か?などについて説明しています。

Citation preview

Page 1: DBpedia Japaneseとは?

DBpedia Japanese とは

武田英明[email protected]@takechan2000

国立情報学研究所NPO 法人 リンクト・オープン・データ・イニシアティブ

Page 2: DBpedia Japaneseとは?

メッセージ• 私たちのグループでは DBpedia Japanese を

構築して、運用しています• (アプリ開発者へ)–Dbpedia Japanese を是非使ってください

• ( Wikipedian へ)– infobox をもっと使ってください。

• (この活動に興味のある方へ)–一緒にオントロジーをつくりましょう。

Page 3: DBpedia Japaneseとは?

Dbpedia とは• Wikipedia の情報を変換して Linked Data と

して使えるようにしたもの

Page 4: DBpedia Japaneseとは?

Linked Data/Linked Open Data(LOD) とは

Page 5: DBpedia Japaneseとは?

普通の Web =文書の Web

Page 6: DBpedia Japaneseとは?

Linked Data = データの Web

このデータに対応する別のデータ

このデータに別のデータと同じ

この属性の意味は?

異なるデータ源のデータが相互に結びつく

Page 7: DBpedia Japaneseとは?

Linked Open Data (LOD)• オープンでリンクできるデータ– 今の Web が“文書の Web” 、 LOD は“データの

Web”• Linked   Data の5原則– 事柄の名前に URI を使うこと– 名前の参照が HTTP URI でできること– URI を参照したときに関連情報が手に入るように

理解可能なデータを提供– 外部へのリンクも含めよう

(必ずしもオープンとは限らない⇒ Linked Data )

Page 9: DBpedia Japaneseとは?

LOD Cloud(Linking Open Data)

200 以上のデータセットが公開され、相互にリンクづけられている

Page 10: DBpedia Japaneseとは?
Page 11: DBpedia Japaneseとは?

“1955-06-08”

Dbpedia の記述

<http://www-kasm.nii.ac.jp/~takeda#me>

<http://southampton.rkbexplorer.com/id/person-07113 >

foaf:knows

<foaf:Person>

rdfs:type

foaf:name foaf:gender

<http://dbpedia.org/resource/Tim_Berners-Lee>

owl:sameAs

dbpprop:birthDatedbpprop:birthPlacedbpprop:name

dbpedia:Computer_scientist

dbpprop:occupation

“ 武田英明” “male”

“London, England”“Sir Tim Berners-Lee”

Page 12: DBpedia Japaneseとは?

http://dbpedia.org/page/Tokyo

Page 13: DBpedia Japaneseとは?

Dbpedia の作り方• 基本的に infobox の情報を変

Page 14: DBpedia Japaneseとは?

DBpedia Mobile

Page 15: DBpedia Japaneseとは?

DBpedia Japanese• DBpedia ( 本家)は英語版 Wikipedia から生成– 名称、概要等は言語リンクを使って多言語もある

• 各国の wikipedia から別の Dbpedia をつくる– チェコ語、オランダ語、フランス語、ドイツ語、

ギリシャ語、イタリア語、韓国語、ポーランド語、ポルトガル語、ロシア語、スペイン語

• 日本語版は 2012 年 4 月にスタート– 国立情報学研究所  LODAC Project– 特定非営利活動法人 リンクト・オープン・データ・

イニシアティブ– + α

Page 16: DBpedia Japaneseとは?
Page 17: DBpedia Japaneseとは?

課題• Infobox がもっとほしい!!– 種類– ページ数

• 英語版 vs. 日本語版– テンプレート数  6,392 vs. 1,675– プロパティ数  161,584 vs. 55,819– テンプレートがあるページ  2,367,449 vs.

473,066

Page 18: DBpedia Japaneseとは?

課題• Infobox を概念にマッピングする(オント

ロジー・マッピング)作業をもっと行う

Page 19: DBpedia Japaneseとは?

頻出テンプレートとそのマッピング状況• 英語版              日本語版

Page 20: DBpedia Japaneseとは?

概念の定義

Page 21: DBpedia Japaneseとは?

プロパティのマッピング

Page 22: DBpedia Japaneseとは?

メッセージ• 私たちのグループでは DBpedia Japanese を

構築して、運用しています• (アプリ開発者へ)–Dbpedia Japanese を是非使ってください

• ( Wikipedian へ)– infobox をもっと使ってください。

• (この活動に興味のある方へ)–一緒にオントロジーをつくりましょう。