Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
IPT2の基本操作ガイド導入と個人利用
GBIF日本ノードJBIF
大澤剛士・戸津久美子
更新日:2017/4/4
http://www.gbif.jp/v2/
生物多様性データメタデータ IPT2(データ管理システム)
DwC / DwC-A
IPT2を使って生物多様性データをDarwin Core Arhiveに再整備する
z
オープンデータ化データペーパー執筆
この資料の目的
• IPT2とは何か
• IPT2の導入
•基本的な使い方
•Darwin Core Archiveの作り方
•データ公開(publish)とデータペーパー化
•付属資料
目次
• IPT2とは何か
• IPT2の導入
•基本的な使い方
•Darwin Core Archiveの作り方
•データ公開(publish)とデータペーパー化
•付属資料
‣ 生物多様性データをDarwin Coreに対応させる
‣ データとメタデータを一括管理する
‣ 世界中のIPT2とデータを共有する
‣ データペーパー作成の補助を行う
Integrated Publication Toolkit ver.2
GBIF公式のデータ管理システム
IPT2とは何か
主な機能:
⇒ここでは扱わない
‣ OS非依存で利用可能
‣ オープンソースソフトウェア
‣ 様々な拡張機能が用意されている
IPT2とは何か
Integrated Publication Toolkit ver.2
ソフトとしての特長:
生物多様性データ・標本等・種名リスト・観察情報
そのデータの説明(メタデータ)
Darwin Core
(DwC)
Ecological Metadata
Language (EML)
•テキスト形式•項目が標準化•拡張項目も多数
• XML形式•拡張性が極めて高い
生物多様性データの標準形式
データとメタデータをまとめてzipで圧縮⇒Darwin Core Archive(DwC-A)
Darwin Core Archive
生物多様性データの標準形式
生物多様性データ・標本等・種名リスト・観察情報
そのデータの説明(メタデータ)
‣ IPT2を使えば、誰でも簡単にDarwin
Core Archiveを作ることができます
IPT2とは何か
Integrated Publication Toolkit ver.2
IPT2とは何か
Integrated Publication Toolkit ver.2
使いどころ:
‣ ファイルサイズの大きいデータを
管理したい
‣ データとメタデータを一体で管理
したい(DwC-Aにしたい)
たとえばエクセル
IPT2に移行
• IPT2とは何か
• IPT2の導入
•基本的な使い方
•Darwin Core Archiveの作り方
•データ公開(publish)とデータペーパー化
•付属資料
• IPT2の簡単な説明や関連文書が集まっている
• 現行バージョンがダウンロードできる
• リリース情報と、過去バージョンも入手可
etc…
GBIF webからダウンロード(http://www.gbif.org/ipt)
IPT2の導入
• 開発情報が集まっている
• 最新版も過去版もβ版もダウンロードできる
• オープンソースなので、ソースコードも入手できる
• バグ等の報告もできる
etc…
Githubにあるプロジェクトページ(https://github.com/gbif/ipt)
IPT2の導入
知識のあるあなたは
• ネットへの接続(厳しいファイアウォール等はないほうがいいかも)
• 256MB以上のメモリ
•本体20MB+データ分のディスク容量
• Javaプラットフォーム (最新版がよいが、version 5以降なら問題なく動作する)
•サーブレットコンテナ (TomcatとかJettyとか)
PCへ導入する際の要件
IPT2の導入
• Javaサイト側で利用可能なバージョン、タイプを判定してくれるので、従うのが簡単
• あとはガイドに従って導入する
1. Java プラットフォームの導入(https://java.com/ja/)
IPT2の導入
•バージョン6以降をダウンロード (8.x以上を推奨)
• Tomcatをインストール (設定は全てデフォルトで問題なし)
• Tomcat serverを立ち上げる
2. サーブレット環境の設定(例:Tomcat) (http://tomcat.apache.org/)
IPT2の導入
Tomcatのインストール画面
Next Next Next…
IPT2の導入
Tomcat Serverの立ち上げ
Tomcatを開始するにはStartボタンをクリック(Configure Tomcat)
IPT2の導入
Tomcatを停止するにはStopボタンをクリック(IPT2の再インストール
・アップグレード時に必要な操作 後述)
•先のwebページから最新版をダウンロードipt-x.x.war (x.x.はバージョン情報)
• ダウンロードしたwar ファイルの名前を変える(例えばipt.warとかが使いやすい)
•名前を変えたwarファイルを Tomcatディレクトリにデプロイする
3. IPT2 のインストール
IPT2の導入
•先のwebページから最新版をダウンロードipt-x.x.war (x.x.はバージョン情報)
IPT2の導入
インストール手順
ファイル名を適当なものに変更
インストール手順
IPT2の導入
• ダウンロードしたwar ファイルの名前を変える(例えばipt.warとかが使いやすい)
Tomcatの“webapps” ディレクトリに名前を変えたwarファイルをコピーする
インストール手順
IPT2の導入
•名前を変えたwarファイルを Tomcatディレクトリにデプロイする
ex) C:/Program Files (x86)/Apache Software Foundation/Tomcat 8.0/webapps
インストール手順
IPT2の導入
•名前を変えたwarファイルを Tomcatディレクトリにデプロイする
Tomcatの“webapps”ディレクトリ内にファイル名と同じディレクトリ(例.ipt)が出来ていれば成功!
•適当なブラウザ(firefoxとか)を立ち上げ、URLに次を入れる(http://localhost:8080/ipt)
この画面が出たら無事に動作しています
IPT2の導入
IPT2の立ち上げ
1. 入れ替えたいバージョンのiptファイルを入手し、名前を変更する(導入時と同じファイル名)
2. Tomcatを停止する
3. 先ほどデプロイしたwebappsディレクトリからwarファイルとディレクトリを削除する
4. Webappsディレクトリに新しいiptファイルをコピーする(デプロイ)
5. Tomcatを開始する
IPT2の導入
IPT2の再インストール/アップグレード手順
※ ipt2を入れ替えてもデータはそのまま引き継がれますが念のためデータディレクトリのバックアップをとりましょう
• IPT2とは何か
• IPT2の導入
•基本的な使い方
•Darwin Core Archiveの作り方
•データ公開(publish)とデータペーパー化
•付属資料
License agreement
(チェック必須)
データディレクトリの設定(任意のディレクトリを指定)
ex) C:/ipt2data
基本的な使い方
初期セットアップ
個人設定を入力(グループ利用なら個人が特定できるように。完全な個人利用なら適当でよい)
“Test” モードを選択
Save!
基本的な使い方
初期セットアップ
これでセットアップは完了です。
Continueを選んで利用画面に
基本的な使い方
初期セットアップ
基本的な使い方
4つの基本画面
※ Test modeで設定したので赤いマークが出ていますが、利用上は全く問題ありません。
基本的な使い方
ログイン、ログアウト、言語の選択
※日本語も選択できますが、全ての画面で翻訳が済んでいるわけではないので、以降の解説も英語画面で行います。
• IPT2とは何か
• IPT2の導入
•基本的な使い方
•Darwin Core Archiveの作り方
•データ公開(publish)とデータペーパー化
•付属資料
Darwin Core Archiveの作り方
扱えるデータ
•生物種の在のみデータを想定
• csv(テキスト)ファイルになっている
•日本語は含めず、英語で統一
•文字コードはUTF-8で統一
• ヘッダの項目は任意
データのイメージ
Manage Resources画面
DwC-Aの作成は、Manage Resource画面から行う
Darwin Core Archiveの作り方
Shortname
(任意で自分がわかるもの)
Type: Occurrence(在データ)
Create!
Darwin Core Archiveの作り方
準備した実験データを選択Addボタンを押す
Darwin Core Archiveの作り方
データの基本項目をチェック“Character Encoding”は UTF-8
Save!
Darwin Core Archiveの作り方
Darwin Core Archiveの作り方
正しく読み込まれているか確認(レコード数「● rows」)
問題なかったらMappingsへDarwin Core Occurrenceを選択して Add
手元データの項目をDwCに対応させること
Darwin Core項目
genus
family
scientificName
手元データの項目
Genus name
Family name
Species name
MappingMappingとは?
今回のデータは在データなので“occurrence”で問題ない“Save”
Darwin Core Archiveの作り方
Darwin Core
項目
ここで手元データの項目を選択し、DwCに対応させる
Darwin Core Archiveの作り方
※必須項目以外は、全て対応させる必要はない
画面の最下部には、まだMappingされていない項目が表示されている。
Darwin Core Archiveの作り方
事前にデータ項目をDwCと同じにしておくとオートマッピングしてくれるので楽
必要な項目のMappingが終わったら “Save” して “Back”
Darwin Core Archiveの作り方
Darwin Core Archiveの作り方
Mappingされた項目数が表示される「● items mapped to…」→間違いないか確認問題なければ、生物データのDwC化は完了
ここからメタデータ作成Metadataの“Edit” を押す
Darwin Core Archiveの作り方
Darwin Core Archiveの作り方
様々なメタデータ項目これを順次入力していく
例:メタデータ項目の地理情報地図上で調査地を設定できる
Darwin Core Archiveの作り方
必要なメタデータを全て入力したら上のManage Resourcesボタンを押す
メタデータで入力したデータタイトル
Darwin Core Archiveの作り方
Manage Resourceトップ画面で入力したデータセットが表示される
データセットを選択すると再び編集画面に入れる
生物データのDwC化とメタデータの作成が完了!
Darwin Core Archiveの作り方
その下にある “Preview”を押す
Darwin Core Archiveの作り方
データセット(生物データ+メタデータ)の全体像を見ることができる
Darwin Core Archiveの作り方
※ Downloadというボタンがあるが、この時点では使えない
• IPT2とは何か
• IPT2の導入
•基本的な使い方
•Darwin Core Archiveの作り方•データ公開(publish)とデータペーパー化
•付属資料
Manage Resourcesの編集画面Metadataの下にあるPublishボタン
これを押すことで、データセットが完成してデータがインターネット上に公開される(注意:今回は個人利用なので、Publishしてもデータはインターネット上に公開されない。データセットの完成だけ)
データ公開(publish)とデータペーパー化
データセットの完成以後、編集をした場合はバージョン番号が付与され、別バージョン扱いになる
データ公開(publish)とデータペーパー化
完成したデータ( DwC-Aファイルやメタデータ)はプレビュー画面からダウンロードできる
データ公開(publish)とデータペーパー化
メタデータ(EML) を開いた例
データ公開(publish)とデータペーパー化
RTFというボタンを押すと、メタデータをデータペーパーっぽい形式に整理したRTFファイルが取得できる
⇒データペーパーはこれをベースに準備
データ公開(publish)とデータペーパー化
• IPT2とは何か
• IPT2の導入
•基本的な使い方
•Darwin Core Archiveの作り方
データをDarwin Core & Darwin Core Archiveに整理する
•データ公開(Publish)とデータペーパー化
•付属資料
今回は標本等の「在」データを扱ったが、種名リストや生態学データも扱うことができる
付属資料
ここから様々なDarwin Coreの拡張項目(遺伝子、画像等)を追加できる
付属資料
GBIF日本ノードJBIF
http://www.gbif.jp/v2/
・各種GBIF発行ドキュメントの和訳版・DwC項目の概説、フォーマットチェッカー・IPT2マニュアルの和訳版など
付属資料
その他役立ちそうな情報
・GBIF community site, IPT interest group(http://community.gbif.org/pg/groups/3529/gbif-ipt-interest-group/)
・Video: How to install the GBIF IPT(https://vimeo.com/116142276)
・Paper from PLOS ONE【The GBIF Integrated Publishing Toolkit: Facilitating the Efficient Publishing of Biodiversity Data on the Internet】(http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0102623)
付属資料