12
メタデータ連携Wikiの提案 東京大学情報基盤センター 学術情報研究部門 助教 清田 陽司 (兼 株式会社リッテル 上席研究員) 2010723@東京大学アントレプレナープラザ会議室

マイニング探検会#04

Embed Size (px)

DESCRIPTION

 

Citation preview

Page 1: マイニング探検会#04

メタデータ連携Wikiの提案

東京大学情報基盤センター

学術情報研究部門 助教

清田 陽司

(兼株式会社リッテル上席研究員)

2010年7月23日@東京大学アントレプレナープラザ会議室

Page 2: マイニング探検会#04

マイニング探検会

「だから」

できることは?

Page 3: マイニング探検会#04

マイニング探検会の「価値」

• 知識の共有

• 多様な組織からの参加者

– 大学図書館、公共図書館、研究機関、出版社…– 国内の大規模メタデータ作成機関

• NDL, NII, JST

Page 4: マイニング探検会#04

図書館の付加価値としてのメタデータ

• 書誌ID– ハイパーリンク付与に不可欠

• 典拠レコード

– 名寄せ問題の解決

– レコメンデーションにも有効

Page 5: マイニング探検会#04

メタデータの課題

• Webサーチエンジン経由のアクセス– URLが付与されていなければクローリングされない = サーチエンジンで探せない

• 書誌IDへの潜在的ニーズの掘り起こし– ASIN(ISBN)がデファクトスタンダード (cf. カーリル)– ISBNが付与されていない文献はどうする?

– 出版間近 or 直後の書籍にもリンクを張りたい

• 機関ごとに別々の体系– それぞれの機関で典拠レコード作成や書誌同定などのeffortがなされている

– コスト大

– お互いに成果を共有できれば….

Page 6: マイニング探検会#04

NDL NII

JST 民間MARC

公共図書館 大学図書館

各種研究機関 出版社

Web

サーチエンジン

オンライン書店(Amazonなど)

Wikipedia

Page 7: マイニング探検会#04

Web情報資源(サーチエンジン)

情報探索のスタート地点

情報の専門性・信頼性

フォークソノミー

Wikipedia

多様な情報資源•入門書•レファレンスブック•各種データベース•学術雑誌論文•過去の文献・資料

図書館分類体系•NDC•BSH

7

Page 8: マイニング探検会#04

ひとつの提案

• Wikipediaの方法論に学んでみては?

• メタデータ体系どうしを「ゆるく」つなぐWikiを構築してみる– 各体系の同一エンティティをつなぐ

– 典拠レコード的に使う

– Botによる自動登録• 書誌同定の成果などをアップロード

– 手作業による修正

– Wikipediaとの連携

• どのようなフォーマットで作るかのアイディアをみんなで出し合う

Page 9: マイニング探検会#04

NDL NII

JST 民間MARC

公共図書館 大学図書館

各種研究機関 出版社

Web

サーチエンジン

オンライン書店(Amazonなど)

Wikipedia連携Wiki

Page 10: マイニング探検会#04

Wikipediaとは?

• オンライン百科事典

– 専門家によるオンライン百科事典プロジェクト「Nupedia」を前身として2001年に発足

– 個人や団体の寄付により運営

• Wikipediaの特徴– 誰もが編集に参加できる (資格制限なし)– ボランティアによる執筆・編集・運営

– Wikiシステム(ブラウザでWeb上のテキストを書き換えることができる)

– 内容は自由に複製・配布・改変できる

Page 11: マイニング探検会#04

多数の参加者による編集

• 基本方針は「誰でも編集できる」

• 秩序維持の仕組みが存在する

– ガイドライン (5つの原則)– ページ毎のノート (議論、合意形成の場)– 管理者によるコントロール

• 保護 (編集合戦への対応)• 削除

• 投稿ブロック

• 管理者の選任・解任

11

Page 12: マイニング探検会#04

Wikipediaのガイドライン5つの原則

• Wikipediaは百科事典– Wikipediaは○○ではない

• 偏見を避ける– 中立的な観点、検証可能性、出典の明記

• 利用はフリー– どの個人も特定の項目を支配できない、著作権侵害の禁止

• 行動規範– 他の参加者に敬意を払う、冷静さの維持

• ルールの精神の尊重– 確固としたルールはない