メタデータ連携Wikiの提案
東京大学情報基盤センター
学術情報研究部門 助教
清田 陽司
(兼株式会社リッテル上席研究員)
2010年7月23日@東京大学アントレプレナープラザ会議室
マイニング探検会
「だから」
できることは?
マイニング探検会の「価値」
• 知識の共有
• 多様な組織からの参加者
– 大学図書館、公共図書館、研究機関、出版社…– 国内の大規模メタデータ作成機関
• NDL, NII, JST
図書館の付加価値としてのメタデータ
• 書誌ID– ハイパーリンク付与に不可欠
• 典拠レコード
– 名寄せ問題の解決
– レコメンデーションにも有効
メタデータの課題
• Webサーチエンジン経由のアクセス– URLが付与されていなければクローリングされない = サーチエンジンで探せない
• 書誌IDへの潜在的ニーズの掘り起こし– ASIN(ISBN)がデファクトスタンダード (cf. カーリル)– ISBNが付与されていない文献はどうする?
– 出版間近 or 直後の書籍にもリンクを張りたい
• 機関ごとに別々の体系– それぞれの機関で典拠レコード作成や書誌同定などのeffortがなされている
– コスト大
– お互いに成果を共有できれば….
NDL NII
JST 民間MARC
公共図書館 大学図書館
各種研究機関 出版社
Web
サーチエンジン
オンライン書店(Amazonなど)
Wikipedia
Web情報資源(サーチエンジン)
情報探索のスタート地点
情報の専門性・信頼性
フォークソノミー
Wikipedia
多様な情報資源•入門書•レファレンスブック•各種データベース•学術雑誌論文•過去の文献・資料
図書館分類体系•NDC•BSH
7
ひとつの提案
• Wikipediaの方法論に学んでみては?
• メタデータ体系どうしを「ゆるく」つなぐWikiを構築してみる– 各体系の同一エンティティをつなぐ
– 典拠レコード的に使う
– Botによる自動登録• 書誌同定の成果などをアップロード
– 手作業による修正
– Wikipediaとの連携
• どのようなフォーマットで作るかのアイディアをみんなで出し合う
NDL NII
JST 民間MARC
公共図書館 大学図書館
各種研究機関 出版社
Web
サーチエンジン
オンライン書店(Amazonなど)
Wikipedia連携Wiki
Wikipediaとは?
• オンライン百科事典
– 専門家によるオンライン百科事典プロジェクト「Nupedia」を前身として2001年に発足
– 個人や団体の寄付により運営
• Wikipediaの特徴– 誰もが編集に参加できる (資格制限なし)– ボランティアによる執筆・編集・運営
– Wikiシステム(ブラウザでWeb上のテキストを書き換えることができる)
– 内容は自由に複製・配布・改変できる
多数の参加者による編集
• 基本方針は「誰でも編集できる」
• 秩序維持の仕組みが存在する
– ガイドライン (5つの原則)– ページ毎のノート (議論、合意形成の場)– 管理者によるコントロール
• 保護 (編集合戦への対応)• 削除
• 投稿ブロック
• 管理者の選任・解任
11
Wikipediaのガイドライン5つの原則
• Wikipediaは百科事典– Wikipediaは○○ではない
• 偏見を避ける– 中立的な観点、検証可能性、出典の明記
• 利用はフリー– どの個人も特定の項目を支配できない、著作権侵害の禁止
• 行動規範– 他の参加者に敬意を払う、冷静さの維持
• ルールの精神の尊重– 確固としたルールはない