Upload
hideaki-takeda
View
2.735
Download
4
Embed Size (px)
DESCRIPTION
Wikimedia Conference Japanでの発表資料です。 DBpeidiaとは何か?そもそもLInked Dataとは何か?などについて説明しています。
Citation preview
メッセージ• 私たちのグループでは DBpedia Japanese を
構築して、運用しています• (アプリ開発者へ)–Dbpedia Japanese を是非使ってください
• ( Wikipedian へ)– infobox をもっと使ってください。
• (この活動に興味のある方へ)–一緒にオントロジーをつくりましょう。
Dbpedia とは• Wikipedia の情報を変換して Linked Data と
して使えるようにしたもの
Linked Data/Linked Open Data(LOD) とは
普通の Web =文書の Web
Linked Data = データの Web
このデータに対応する別のデータ
このデータに別のデータと同じ
この属性の意味は?
異なるデータ源のデータが相互に結びつく
Linked Open Data (LOD)• オープンでリンクできるデータ– 今の Web が“文書の Web” 、 LOD は“データの
Web”• Linked Data の5原則– 事柄の名前に URI を使うこと– 名前の参照が HTTP URI でできること– URI を参照したときに関連情報が手に入るように
理解可能なデータを提供– 外部へのリンクも含めよう
(必ずしもオープンとは限らない⇒ Linked Data )
明日 2/4 発売開始
Linked Data: Web をグローバルなデータ空間にする仕組み– トム ヒース ( 著 ),
クリスチャン バイツァー ( 著 )
– 近代科学社
LOD Cloud(Linking Open Data)
200 以上のデータセットが公開され、相互にリンクづけられている
“1955-06-08”
Dbpedia の記述
<http://www-kasm.nii.ac.jp/~takeda#me>
<http://southampton.rkbexplorer.com/id/person-07113 >
foaf:knows
<foaf:Person>
rdfs:type
foaf:name foaf:gender
<http://dbpedia.org/resource/Tim_Berners-Lee>
owl:sameAs
dbpprop:birthDatedbpprop:birthPlacedbpprop:name
dbpedia:Computer_scientist
dbpprop:occupation
“ 武田英明” “male”
“London, England”“Sir Tim Berners-Lee”
http://dbpedia.org/page/Tokyo
Dbpedia の作り方• 基本的に infobox の情報を変
換
DBpedia Mobile
DBpedia Japanese• DBpedia ( 本家)は英語版 Wikipedia から生成– 名称、概要等は言語リンクを使って多言語もある
• 各国の wikipedia から別の Dbpedia をつくる– チェコ語、オランダ語、フランス語、ドイツ語、
ギリシャ語、イタリア語、韓国語、ポーランド語、ポルトガル語、ロシア語、スペイン語
• 日本語版は 2012 年 4 月にスタート– 国立情報学研究所 LODAC Project– 特定非営利活動法人 リンクト・オープン・データ・
イニシアティブ– + α
課題• Infobox がもっとほしい!!– 種類– ページ数
• 英語版 vs. 日本語版– テンプレート数 6,392 vs. 1,675– プロパティ数 161,584 vs. 55,819– テンプレートがあるページ 2,367,449 vs.
473,066
課題• Infobox を概念にマッピングする(オント
ロジー・マッピング)作業をもっと行う
頻出テンプレートとそのマッピング状況• 英語版 日本語版
概念の定義
プロパティのマッピング
メッセージ• 私たちのグループでは DBpedia Japanese を
構築して、運用しています• (アプリ開発者へ)–Dbpedia Japanese を是非使ってください
• ( Wikipedian へ)– infobox をもっと使ってください。
• (この活動に興味のある方へ)–一緒にオントロジーをつくりましょう。