13

Click here to load reader

OR2012report_suppl

Embed Size (px)

DESCRIPTION

http://www.nii.ac.jp/sparc/event/2012/pdf/20121026_abs2.pdf の補足です。

Citation preview

Page 1: OR2012report_suppl

Open Repositories 2012 参加メモ

註:

1. 本稿は、Open Repositories 2012(OR2012. 2012/07/09-2012/07/13 @Edinburgh htt

p://or2012.ed.ac.uk/ )の参加報告書(*)に盛り込めなかったいくつか(ワークショップ、

テーマ別セッション)について、概略をまとめたメモを参考までに公開するものです。

2. OR2012 プログラム( https://www.conftool.net/or2012/sessions.php )と併せてご参

照ください。なお、OR2012 での発表資料等の多くはこの公式サイト等で公開されています

ので、原文もご確認くださいますようお願いいたします。

3. 記述や理解の誤り等お気付きの点がありましたらご指摘ください。

2012/10/15

-----

*参加報告書は以下で公開されています(こちらは共著です):

http://www.nii.ac.jp/sparc/event/2012/pdf/20121026_abs2.pdf

Page 2: OR2012report_suppl

ワークショップ

ISL1: Workshop: Islandora - Getting Started

Monday, 09/Jul/2012: 9:30am - 12:30pm

【内容紹介】

Islandora(アイランドラ)は、 University of Prince Edward Island が開発した、様々な

デジタルコレクション・研究分野に対応するデジタル資源管理システムで、共にオープン

ソースのコンテンツマネジメントシステム Drupal とリポジトリソフトウェア Fedora を組

み合わせて構築されている。本ワークショップではシステムの概要説明、デモンストレー

ションが行われた。

Islandora は 100 超の機関に採用されており、コミュニティには図書館だけでなく博物館も

含まれている。コンテンツ種別ごとに設計された、ソリューションパックと呼ばれるアプ

リケーションが提供されており、books solution pack のデモでは、本のページをめくるよ

うに閲覧できる画面表示、検索キーワードのハイライト表示機能などが紹介された。

Islandora のアーキテクチャやロードマップにとって鍵となるのが Fedora のコンテンツモ

デルアーキテクチャ(CMA)だが、コンテンツはすべてオブジェクトとみなされ、永続的

な識別子を持つ、オブジェクトはデータストリームを持つ、メタデータとコンテンツを分

離せずにアーカイヴする、等の特徴が説明された。

Page 3: OR2012report_suppl

テーマ別セッション

P1B: Shared Repository Services and Infrastructure (1)

Tuesday, 10/Jul/2012: 3:30pm - 6:00pm

【内容紹介】

本セッションでは、リポジトリサービスとインフラの共有化をテーマとした 5 つの報告が

あった。

※下記に挙げたもの以外の4報告は割愛(参加報告書をご参照ください)

(5)"The World Bank Open Knowledge Repository: Open Access with global development

impact" / Lieven Droogmans (@mire), Tom Breineder, Matthew Howells, Carlos Rossel

(World Bank)

世界銀行(WB)では 2010 年にオープンデータ・イニシアティヴを発表後、WB が助成や

出版を行った研究成果やその付随データ等のオープンアクセス化を目標とし、2012 年 7 月

には登録を義務化する方針も発表した。WB により出版された著作物と、外部で出版された

WB 職員の著作物とで運用方針を分けており、著者最終稿とメタデータを Open Knowledge

Repository に登録する点では共通しているが、CC ライセンスが前者は CC-BY であるのに

対し後者は CC-BY-NC-ND である点、後者の公開ポリシーが、WB 内部では登録後すぐに

利用可能とするのに対し、外部向けには出版者のエンバーゴ後とする点が異なる。今後の

展開としては、コンテンツの拡充、機能向上(著者プロフィール、投稿ワークフロー、利

用統計)、銀行システムとの統合が挙げられた。また、実装面での課題として分類とファセ

ット検索が挙げられ、著者や出版年、分類による絞込み検索が可能である。また、分類の

階層化と表示アイテム数のカウント方法との整合性を改善し、この経験は DSpace3.0 にも

活かされていることが説明された。

Page 4: OR2012report_suppl

RF2: Repository Fringe - Open Access Index

Wednesday, 11/Jul/2012: 9:00am - 10:30am

【内容紹介】

Open Access Index は JISC の助成を受けた新しいイニシアティヴで、著者の OA への参加

度をシンプルな数値で計測する方法の構築が目指されている。計測のソースとしては、Web

of Science のような大規模な文献データベース、CRIS(Current Research Information

System)、リポジトリ、SHERPA Romeo 等が考えられるとのことである。セッションでは

このようなインデックスが有用であるか、どのように計測すべきか、等が話し合われた。

ニーズについては、学術情報流通に大きな役割を持つリポジトリマネージャが研究者と話

をする際等、OA 促進の広報に有用では、といった肯定的な意見が出された。インデックス

対象者については、研究者だけでなく資金提供者も挙げられた。また、分野ごとの違いを

考慮する必要がある、母数が定まらない場合パーセンテージを示すのは難しい、適切なイ

ンデックスを作成するのは難しい、といった指摘もなされた。ビジネスモデルとして興隆

するゴールド OA をどう考えるかも話題に上り、その場合グリーン OA インデックスだと

人の評価は低く、ゴールド OA インデックスだと資金提供者の評価は高くなるが、資金提

供者の関心は経済的側面にあることを考慮すべきとの意見が出された。論文数等のカウン

ト方法について、全ての OA 論文のインデックスは存在しないので他のインデックスから

導き出すしかない、また、論文の質についてインデックスに含めるのは難しい、との説明

もあった。

なお、この Open Access Index に関するアンケート調査が 6 月 22 日から 7 月 23 日までオ

ンラインで行われ、その回答をまとめたものが以下のページで公開されているので参照頂

きたい:http://oaindex.org/blog/2012/07/oa-index-survey-results-a-precis/ 。インデック

スの詳細は今後さらに詰められていくようである。

Page 5: OR2012report_suppl

RF3: Pecha Kucha - National Infrastructures

Wednesday, 11/Jul/2012: 11:00am - 12:30pm

【内容紹介】

国レベルのインフラをテーマに 7 つの発表が行われた。

(1)"Open Access Statistics: Transforming a project into a service" / Daniel Beucke,

Julika Mimkes, Saskia Brauns (Göttingen State and University Library, Germany),

Justine Haeberli (Stuttgart University Library, Germany)

"Open Access Statistics(OAS)"は、雑誌単位ではなく論文単位の影響度がわかる利用統

計に着目したドイツのプロジェクトで、リポジトリやオープンアクセス誌の論文アクセス

をカウントする。国際的に比較可能な利用統計を収集し、この利用データの収集・処理の

ための持続的インフラを提供することで、著者や利用者の間におけるオープンアクセス受

容の促進を目標としている。出版プラットフォームや資源タイプ、国、言語、分野に関わ

らず利用統計の国際的な比較ができるよう、OAS と国内外のパートナーは収集や交換、利

用データの分析のための統一基準について合意している。2013 年には OAS インフラが

GBV サービスに組み込まれる予定とのことである。

なお、論文のインパクトを測るものとして、利用、査読、引用、Altmetrics を挙げ、次は

Altmetrics に取り組みたいとの説明があった。

(2)"The Library Consortium of New Zealand's Shared IRR Infrastructure" / Allison

Brown (The University of Otago, New Zealand), Andrew Lockett (Unitec Institute of

Technology, New Zealand), Craig Murdoch (AUT University, New Zealand), Kate Nixon,

Andrea Schweer (The University of Waikato, New Zealand)

The Library Consortium of New Zealand が進めてきた "Institutional Research

Repository"プロジェクトの紹介が行われた。コンソーシアム構成員のうち Victoria 大学は

自機関リポジトリを持つが、AUT、Otago、Waikato の 3 大学と Unitec の 1 機関がこのプ

ロジェクトに参加しており、Waikato 大学の情報技術サービスが各機関リポジトリのホス

ティングを行うとともに、専任の技術専門職を置き、プロジェクト管理も行っている。各

リポジトリの運用方針や優先順位はそれぞれ異なっているが、このコミュニティで知識や

スキル、リスク、改善、コスト等を共有し、自機関構築よりも共同構築の方がカスタマイ

ズやアップグレードも効果的に行える等のメリットが説明された。

※本項は参加報告書の内容と同一です

(3)"Link globally, act locally: How the second wave of repositories in Australian

universities, for research data, will learn from the first wave of publications

Page 6: OR2012report_suppl

repositories" / Peter Malcolm Sefton, Vicki Picasso, Anna Shadbolt, Simon Porter,

Caroline Drury (University of Western Sydney, Australia)

政府の後押しによりオーストラリアでは全大学が機関リポジトリを有しており、大学の成

果物のメタデータや本文を登録しているが、この出版物リポジトリの次の段階として、研

究データを収集するデータリポジトリの構築に現在取り組んでいることが紹介された。従

来の出版物リポジトリでは各機関のメタデータ記述が標準化されていない問題点があるが、

データリポジトリ構築にあたっては他システムとの連携にも配慮しているとの説明があっ

た。このほか、メタデータの記述内容をより豊富にすることにも注目しているとのことで

ある。

(4)"Planning and building a Trusted Digital Repository at RCAHMS" / Emily Nimmo

(RCAHMS, United Kingdom)

The Royal Commission on the Ancient and Historic Monuments of Scotland (RCAHMS)

から、信頼できるデジタルリポジトリにするための取り組みについて報告が行われた。信

頼できるリポジトリ設計の 10 原則として以下が挙げられた:(1)デジタルオブジェクトの絶

え間ないメンテナンス、(2)機関に適合していること、(3)必要な権利の取得・維持、(4)効果

的な方針の枠組み、(5)規定の基準を用いたデジタル・オブジェクトの取得・収集、(6)信頼

性・利用しやすさの維持・保証、(7)必要なメタデータの作成・維持、(8)普及の要件を充た

すこと、 (9)保存の企画・実行のための戦略的計画、 (10)適切な技術インフラ。

DigitalPreservationEurope(DPE)が提供している、信頼できるデジタルリポジトリを企

画するためのツール”PLATTER: Planning Tool for Trusted Electronic Repositories”や、デ

ジタル情報の長期保存のためのシステム構築の指針である「OAIS 参照モデル」に沿って取

り組んでいることが説明された。

このほか、建築物等を 3 次元レーザースキャンした画像もリポジトリで提供しており、こ

れは xyz フォーマット等でエクスポートもできる事が紹介された。

(5)"Researcher Identifiers and National Federated Search Portal for Japanese

Institutional Repositories" / Kei Kurakawa, Hideaki Takeda, Ryo Shiozaki (National

Institute of Informatics, Japan), Shun Morimoto, Hideki Uchijima (Kanazawa

University Library, Japan)

研究者の名前の曖昧性に関する問題(同姓同名や旧姓、漢字異体字など)を解決するため、

研究者に識別子を付与することが求められているが、日本の NII による「研究者リゾルバ」

は、研究者 ID の管理や、研究者ページでのプロフィール表示、外部システムとのリンキン

グ等を行っていること、また、JAIRO の著者名典拠として位置づけられており、JAIRO で

の著者名検索が可能となっていることが紹介された。

将来的には、ORCID や Microsoft Academic Search のような外部の国際的サービスとのリ

Page 7: OR2012report_suppl

ンキングも考えているとの展望も示された。

(6)"Bringing the benefits of OER to Scotland’s colleges" / Jackie Graham, Allan Forsyth,

Ben Ryan (Scotland's Colleges, United Kingdom)

Scotland's Colleges ならびに教育・学習資源ポータル"Jorum"は、スコットランドの大学に

おける学習・教育支援としてオンライン公開の教育リソース"Open Educational Resources"

(OER)の利用を促進することについて協働して先頭に立っている。2012 年秋に OER の

新しいプラットフォーム"Re:Source"をリリース予定で、スコットランド内のリポジトリな

らびに Jorum のコンテンツの検索や、科目に特化した検索が出来るようになるなど、教師

にとって使いやすく魅力あるものになると紹介された。既存の資源を利用することでコス

トも抑えられているとのことである。

(7)"The United Kingdom Council of Research Repositories" / Paul Stainthorp

(University of Lincoln, United Kingdom), Dominic Tate (United Kingdom Council of

Research Repositories (UKCoRR, United Kingdom)

UKCoRR の活動紹介等が行われた(その特徴は 10 日の RSP WS におけるプレゼンテーシ

ョン内容でも触れられているため割愛する)。UKCoRR は、リポジトリ管理業務が、イギ

リスの研究機関において専門的かつ研究支援の役割を担うという展望を持っているとのこ

とである。

Page 8: OR2012report_suppl

P4B: Shared Repository Services and Infrastructure (2)

Wednesday, 11/Jul/2012: 1:30pm - 3:00pm

【内容紹介】

本セッションでは、リポジトリサービスとインフラの共有化をテーマとした 3 つの報告が

あった。

(1)"A Repository-based Architecture for Capturing Research Projects at the

Smithsonian Institution" / Thorny Staples (Smithsonian Institution, United States of

America)

スミソニアン協会は現在、博物館 19、研究センター9、高等学術センター8、図書館 22、ア

ーカイヴ 2、動物園 1 を有しており、研究活動やその支援がこれらすべての部署で行われて

いる。デジタルコンテンツのシステマティックなデータ管理は従来行ってこなかったが、

これら多分野の研究活動を支援するため、スミソニアンはリポジトリで可能となったヴァ

ーチャルな研究環境を開発している。これは、学術的レコードは急速に生成され、コンテ

ンツのネットワークを形成し、その各ノードは他のノードと定型化された関係でつながっ

ているはずだ、という仮定に基づいた試みで、テクストだけでなく、画像、動画、音声、

表のデータセットも含むあらゆるデジタルメディアがサポート対象である。オブジェクト

は resource objects(テキストやイメージ等)と concept objects(リソースの構造や文脈の

ノードを記述)の 2 種類に分け、構造関係も当初は「isConceptOf」と「isResourceOf」の

2 種類のみ。Islandora/Fedora を用いたプロトタイプを示しながら説明が行われた。

(2)"Open Access Repository Registries: unreleased Infrastructure" / Richard Jones

(Cottage Labs, United Kingdom), Sheridan Brown (Key Perspectives, United Kingdom),

Emma Tonkin (UKOLN, University of Bath, United Kingdom)

現在オープンアクセス・リポジトリのレジストリは複数あり、OpenDOAR、ROAR、

BioRepositories、re3data、Ranking Web of World Repositories がその代表的なものであ

る。また、これらレジストリを基にしたサービスも複数あり、BASE、Institutional

Repository Search、Repository66、OA-RJ がその代表的なものである。各レジストリを比

較すると、例えばOpenDOARとROARでは各リポジトリについての記述やコンタクト先、

RSS フィードの有無等に関して充実度の差異が見受けられる。つまり既存のレジストリで

は必ずしも最適の情報提供がなされているとは言えず、コンテンツ数の統計は信頼性に欠

ける、複数言語対応していない、改訂履歴が十分に提供されていない、リポジトリと組織

との関係性が明らかでない、SWORD のような新しい項目を普及させる方針やメカニズム

がない、といった重大な制約がある。

Open Access Repository Registry(OARR)プロジェクトではこれらの改善を目指し、正

Page 9: OR2012report_suppl

当性、信頼性、自動化、更新性、十分な管理、広いスコープといった要素を備え、さらに

レジストリのグラフィカル表示、API 提供、履歴提供といったことにも取り組むとのこと

である。これにより、各リポジトリの比較やランキング、OA の動向に対する指標となる、

との説明がなされた。

(3)"Collabratorium Digitus Humanitas: Building a Collaborative DH Repository

Framework" / Mark Leggott (University of PEI, Canada), Dean Irvine (Dalhousie

University, Canada), Susan Brown (University of Guelph/University of Alberta,

Canada), Doug Reside (New York Public Library, United States of America), Julia

Flanders (Brown University, United States of America)

デジタル人文学は活発に発展してきた分野で、コレクションの見せ方や人文学における学

術論考への様々な創造的なアプローチがその象徴である。各プロジェクトは特定の分野に

特化しているが、これらは、より広い学術コミュニティや一般に向けて成果の集成を見せ

るように設計された、大きなデジタル化プロジェクトとなることが可能である。これらの

システムやコレクションを全体でまとめればデジタル人文学研究の豊かな展望がもたらさ

れる。

相互運用性のあるツールの構築や、共通のソフトウェアフレームワークに基づいたある程

度の標準化が取り組まれてきたが、共通フレームワークの 1 つの核が強固な保存プラット

フォームをもたらすリポジトリシステムである。本セッションでは、Islandora システムを

基盤として用い、デジタル人文学研究の共通フレームワークを開発することに取り組んで

きた Editing Modernism in Canada(EMiC)プロジェクトの紹介が行われた。

Page 10: OR2012report_suppl

P5B: Name and Data Identifiers

Wednesday, 11/Jul/2012: 3:30pm - 5:00pm

【内容紹介】

本セッションでは、著者やデータの識別子をテーマとした 3 つの報告があった。

(1)"ORCID update and why you should use ORCIDs in your repository" / Simeon

Warner (Cornell University and ORCID Inc.)

学術コミュニケーションにおいて著者や貢献者の確かな帰属には固有の個人レベルの識別

子が不可欠だが、出版者、学会、財団、大学、研究所など、研究者の識別子に関心のある

いくつかの主要なステークホルダーが協働してこの問題に取り組むため設立したのが

ORCID である。他の同様の取り組みと異なっているのは、ORCID では研究者だけでなく

貢献者にも永続的な固有の識別子が付与され、かつこのレジストリが他のシステムと連携

することである。ORCID には現在世界中から 328 組織が参加している。

ORCID で研究者を特定できるようになることはリポジトリにとってもメリットがある。著

者から見ると、自身の ORCID と著作物とが関連付けられることで適切なクレジットを得ら

れることが期待できる。研究コミュニティ全体から見ると、よりよい発見・分析ツール提

供が可能となる。大学・研究機関から見ると、出版物の追跡が容易となり、リポジトリと

研究者情報システムと著作物との強固なリンクが促進されるだろう。

出版者やリポジトリ、ブログのような Web コンテンツ、その他様々なデータベースが有す

る著者識別子を ORCID でつなぎ、複数の学術情報サービスが連携することで、各サービス

の効果は非常に高いものとなる。なお ORCID と連携するための API は、無料版と有料版

の 2 種類提供され、それぞれ異なる権限が与えられる。

(2)"How dinosaurs broke our system: challenges in building national researcher

identifier services" / Amanda Hill (University of Manchester)

イギリスにおける国家的著者識別子サービスの構築を行ってきた、JISC 助成の Names プ

ロジェクトについて、その経験や達成事項、課題の報告が行われた。Names システムはま

ず MERIT プロジェクトで得られたデータ(イギリスの研究者捕捉率は約 20%)を基に作

られ、その後機関リポジトリのデータに取り組み、内部の識別子と Names システムの ID

との連携処理(ID がない場合は新規に作成)を行っているほか、British Library(BL)の

データセット(Zetoc)取り込みも行っている。また Names のサイトでは ID を持っていな

い著者が自らデータ作成を行うこともできる。他のデータソースからデータを取り込む際

には、自動マッチングだけではなく、BL のスタッフがマッチング結果の目視チェックを行

い、また今後は著者自身によるデータ修正も認める方向とのことで、質の担保を図ってい

る。

Page 11: OR2012report_suppl

Names システムでは API も提供しているが、2011 年に Names のデータを著者フィールド

に自動入力する E-Prints プラグインの提供を始め、今年中には、Names のデータを新規作

成するために E-Prints システムから Names システムへデータを送り返すこともできるよ

うに機能拡張される予定である。

各国の国家的システム同様 ORCID と連携し、また OCLC の VIAF や ISNI のような関連

のある国際的成果とのデータ共有も行っている。

なお Web of Science のような商業データベースで用いられている著者識別子システムとの

連携はまだ行われていない。

(3)"Creating Citable Data Identifiers" / Ryan Scherle (Dryad Digital Repository), Mark

Diggory (@mire)

近年データ・アーカイヴの重要性が増しているが、利用されやすい効果的なデータ引用の

ために、リポジトリの識別子スキームは研究者のニーズに応える必要がある。

科学分野における引用のほとんどの状況でうまく機能するのでは、と引用可能な識別子に

ついて以下の 5 原則が提案された:(1)データの識別子は DOI を用いる、(2)識別子はできる

だけシンプルに、(3)シンタクスを用いて関係を明示する、(4)データの内容に変更があった

らバージョン管理された識別子を付与する、(5)データの内容には変更がなくメタデータに

変更がある場合は現在の識別子を維持する。あわせてその理由と、EPrints、DSpace、Fedora

の各システムの対応状況も説明された:(1)は、研究者がもっともなじみがあるのは Handle

システムではなく DOI システムであることが理由。EPrints、DSpace は未対応、Fedora

は対応。(2)は、機械には複雑でも問題ないが、人が利用するにはシンプルであるべきとい

うことが理由。EPrints、DSpace、Fedora すべて対応。(3)も、人にとっての利用しやすさ

が理由。EPrints、DSpace は未対応、Fedora は対応。(4)は、レビューや分析のためには、

データの改訂の履歴が明らかで、かつ各バージョンが引用可能である必要があることが理

由。バージョン管理については、EPrints はほぼ対応、DSpace は未対応、Fedora は対応。

以上を踏まえ、今後の方向性として、DSpace をデータ引用に適したものに改善する必要が

あり、ユーザ・コミュニティと議論していくことが示された。

昨年データ・リポジトリ Dryad にデータを収めている 186 論文について調べたところ、論

文からデータへの適切な引用を行っているのが 77%、不適切な引用を行っているのが 2%、

引用を行っていないのが 21%。データ引用の規則はまだ発展段階である。リポジトリ・マ

ネージャに対して、リポジトリ外でデータがどのように用いられ引用されているか分析し、

自機関のリポジトリでのデータ管理方針を決め、うまく機能するシステムとなるよう取り

組んでいくべきである、との指摘で締め括られた。

Page 12: OR2012report_suppl

P6B: Digital Preservation

Thursday, 12/Jul/2012: 9:00am - 11:00am

【内容紹介】

本セッションでは、デジタル保存をテーマとした 4 つの報告があった。

(1)"Building a Digital Preservation Network" / Michele Kimpton (DuraSpace, United

States of America), Robin Ruggaber (University of Virginia, United States of America)

Digital Preservation Network(DPN)イニシアティヴは、学術的な記録をデジタル形式で

長期的に保存していくためのエコシステムを提案するもので、大規模、持続可能で、高等

教育機関における既存の収集・保存システムを補完するシステムを想定している。このエ

コシステムで既存のリポジトリを統合し、登録コンテンツ全てを保存を目的に複製する。

DPN には現在アメリカの 54 機関が参加している。

DPN の原則として、学術機関が保有すること、様々な地域にまたがること、様々な機関が

関与すること、様々なソフトウェア・アーキテクチャが関与すること、様々な政治的環境

下にあること、が挙げられた。いくつかのリポジトリのまとまりごとにコンテンツの複製

を行うノードが設定され、それらは長期保存に特化する。各ノード同士でも複製を行うこ

とで、参加機関全てのコンテンツの複製が複数箇所で保有されることになる。これらのノ

ードが組織的・技術的・物理的・政治的多様性を持つことにより、リスク分散を図ってい

ると言える。

(2)"ISO 16363: Trustworthy Digital Repository Certification in Practice" / Matthew

Kroll (Purdue University, United States of America), David Minor (University of

California San Diego, United States of America), Bernie Reilly (Center for Research

Libraries, United States of America), Michael Witt (Purdue University, United States of

America)

ISO16363 と Trustworthy Repository Audit Checklist(TRAC)について取り上げられ、

データの正しく確実な保存や同一性についてどのようにユーザから信頼を得られるかとい

う課題について対応してきた実践例が紹介された。

うち Purdue 大学は、信頼できるリポジトリは、管理されたデジタル資源を指定のコミュニ

ティに対して現在も将来も確かな長期的アクセスを提供する、との定義を紹介した上で、

信頼できることのためには、完全性、持続可能性、サポートの 3 つの質が重要ではないか、

これらを自組織や ISO16363 項目と関連付けて配することが重要だろうと述べた。具体例

としては、組織が十分なスタッフと資金を持っていること、変化し続ける需要に適切に対

応できるようにスタッフをトレーニングすること、等が挙げられた。また、準備すること

とは、自己を過大評価しないことだとの指摘がなされた。

Page 13: OR2012report_suppl

(3)"Stewardship and Long Term Preservation of Earth Science Data by the ESIP

Federation" / Nancy J. Hoebelheinrich (Knowledge Motifs LLC, United States of

America)

ESIP Federation による地球科学データの管理と長期保存について報告が行われた。

Earth Science Information Partners(ESIP)は 1998 年に NASA によって創設され、科

学データインフラ構築に携わっているような、科学データ・技術の専門家のネットワーク

で、地球科学コミュニティが運営・管理するボランタリーでオープンな集まりである。現

在 141 のメンバーから構成され、機関のデータセンター、研究者やツール開発者、アプリ

開発者、スポンサーの 4 種に分けられる。ESIP はデータ情報科学やデータ科学に関わるこ

とで活動しているが、機関や、政府・商業・非営利・学術といったセクターや、地球科学・

環境科学・コンピュータ科学・社会科学といった分野を越えたコネクション形成を支援し

ている。

活動内容は、識別子等のテストベッド運用、ワークショップ開催、データ管理の短期講座

開催、教育など多岐にわたる。うちデータ保存・管理に関する活動として、データ管理原

則の作成(データの作成者、仲介者、ユーザを対象)、データ引用ガイドラインの作成、デ

ータオブジェクトのための識別子の検討等が挙げられた。データオブジェクトのための識

別子に関しては、8 つの ID スキーム(DOI, ARK, UUID, XRI, OID, Handles, PURL, LSID,

[URI, URN, URL])の評価が行われた後、現在各 ID の運用についてテストベッドを利用し

た検証を行っているとのことである。

(4)"Preservation in the Cloud: Three Ways" / Michele Kimpton (DuraSpace, United

States of America), Richard Rodgers (Massachusetts Institute of Technology, United

States of America), Mark Leggott (Discovery Garden, Canada), & Simon Waddington

(King's College London, United Kingdom)

DuraCloud は、クラウドインフラを利用した管理サービスで、保存サポートやアクセスサ

ービス提供を行っており、その利用事例の報告が行われた。

うち MIT では、様々なタイプのコンテンツが含まれるリポジトリの、手ごろで地理的に分

散した複製を設置することを主目的に DuraCloud を用いている。ただ、容量の大きいファ

イルはクラウドでの双方向通信には不向きで、複製のスピードの遅れ、待機状態化、同期

の失敗等が起こり得るのが課題だとの指摘もなされた。