62
IPT2の基本操作ガイド 導入と個人利用 GBIF日本ノードJBIF 大澤 剛士・戸津 久美子 更新日:2017/4/4 http://www.gbif.jp/v2/

IPT2の基本操作ガイド · 2017. 6. 23. · •IPT2とは何か •IPT2の導入 •基本的な使い方 •Darwin Core Archiveの作り方 •データ公開(publish)とデータペーパー化

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

  • IPT2の基本操作ガイド導入と個人利用

    GBIF日本ノードJBIF

    大澤剛士・戸津久美子

    更新日:2017/4/4

    http://www.gbif.jp/v2/

  • 生物多様性データメタデータ IPT2(データ管理システム)

    DwC / DwC-A

    IPT2を使って生物多様性データをDarwin Core Arhiveに再整備する

    z

    オープンデータ化データペーパー執筆

    この資料の目的

  • • IPT2とは何か

    • IPT2の導入

    •基本的な使い方

    •Darwin Core Archiveの作り方

    •データ公開(publish)とデータペーパー化

    •付属資料

    目次

  • • IPT2とは何か

    • IPT2の導入

    •基本的な使い方

    •Darwin Core Archiveの作り方

    •データ公開(publish)とデータペーパー化

    •付属資料

  • ‣ 生物多様性データをDarwin Coreに対応させる

    ‣ データとメタデータを一括管理する

    ‣ 世界中のIPT2とデータを共有する

    ‣ データペーパー作成の補助を行う

    Integrated Publication Toolkit ver.2

    GBIF公式のデータ管理システム

    IPT2とは何か

    主な機能:

    ⇒ここでは扱わない

  • ‣ OS非依存で利用可能

    ‣ オープンソースソフトウェア

    ‣ 様々な拡張機能が用意されている

    IPT2とは何か

    Integrated Publication Toolkit ver.2

    ソフトとしての特長:

  • 生物多様性データ・標本等・種名リスト・観察情報

    そのデータの説明(メタデータ)

    Darwin Core

    (DwC)

    Ecological Metadata

    Language (EML)

    •テキスト形式•項目が標準化•拡張項目も多数

    • XML形式•拡張性が極めて高い

    生物多様性データの標準形式

  • データとメタデータをまとめてzipで圧縮⇒Darwin Core Archive(DwC-A)

    Darwin Core Archive

    生物多様性データの標準形式

    生物多様性データ・標本等・種名リスト・観察情報

    そのデータの説明(メタデータ)

  • ‣ IPT2を使えば、誰でも簡単にDarwin

    Core Archiveを作ることができます

    IPT2とは何か

    Integrated Publication Toolkit ver.2

  • IPT2とは何か

    Integrated Publication Toolkit ver.2

    使いどころ:

    ‣ ファイルサイズの大きいデータを

    管理したい

    ‣ データとメタデータを一体で管理

    したい(DwC-Aにしたい)

    たとえばエクセル

    IPT2に移行

  • • IPT2とは何か

    • IPT2の導入

    •基本的な使い方

    •Darwin Core Archiveの作り方

    •データ公開(publish)とデータペーパー化

    •付属資料

  • • IPT2の簡単な説明や関連文書が集まっている

    • 現行バージョンがダウンロードできる

    • リリース情報と、過去バージョンも入手可

    etc…

    GBIF webからダウンロード(http://www.gbif.org/ipt)

    IPT2の導入

  • • 開発情報が集まっている

    • 最新版も過去版もβ版もダウンロードできる

    • オープンソースなので、ソースコードも入手できる

    • バグ等の報告もできる

    etc…

    Githubにあるプロジェクトページ(https://github.com/gbif/ipt)

    IPT2の導入

    知識のあるあなたは

  • • ネットへの接続(厳しいファイアウォール等はないほうがいいかも)

    • 256MB以上のメモリ

    •本体20MB+データ分のディスク容量

    • Javaプラットフォーム (最新版がよいが、version 5以降なら問題なく動作する)

    •サーブレットコンテナ (TomcatとかJettyとか)

    PCへ導入する際の要件

    IPT2の導入

  • • Javaサイト側で利用可能なバージョン、タイプを判定してくれるので、従うのが簡単

    • あとはガイドに従って導入する

    1. Java プラットフォームの導入(https://java.com/ja/)

    IPT2の導入

  • •バージョン6以降をダウンロード (8.x以上を推奨)

    • Tomcatをインストール (設定は全てデフォルトで問題なし)

    • Tomcat serverを立ち上げる

    2. サーブレット環境の設定(例:Tomcat) (http://tomcat.apache.org/)

    IPT2の導入

  • Tomcatのインストール画面

    Next Next Next…

    IPT2の導入

  • Tomcat Serverの立ち上げ

    Tomcatを開始するにはStartボタンをクリック(Configure Tomcat)

    IPT2の導入

    Tomcatを停止するにはStopボタンをクリック(IPT2の再インストール

    ・アップグレード時に必要な操作 後述)

  • •先のwebページから最新版をダウンロードipt-x.x.war (x.x.はバージョン情報)

    • ダウンロードしたwar ファイルの名前を変える(例えばipt.warとかが使いやすい)

    •名前を変えたwarファイルを Tomcatディレクトリにデプロイする

    3. IPT2 のインストール

    IPT2の導入

  • •先のwebページから最新版をダウンロードipt-x.x.war (x.x.はバージョン情報)

    IPT2の導入

    インストール手順

  • ファイル名を適当なものに変更

    インストール手順

    IPT2の導入

    • ダウンロードしたwar ファイルの名前を変える(例えばipt.warとかが使いやすい)

  • Tomcatの“webapps” ディレクトリに名前を変えたwarファイルをコピーする

    インストール手順

    IPT2の導入

    •名前を変えたwarファイルを Tomcatディレクトリにデプロイする

    ex) C:/Program Files (x86)/Apache Software Foundation/Tomcat 8.0/webapps

  • インストール手順

    IPT2の導入

    •名前を変えたwarファイルを Tomcatディレクトリにデプロイする

    Tomcatの“webapps”ディレクトリ内にファイル名と同じディレクトリ(例.ipt)が出来ていれば成功!

  • •適当なブラウザ(firefoxとか)を立ち上げ、URLに次を入れる(http://localhost:8080/ipt)

    この画面が出たら無事に動作しています

    IPT2の導入

    IPT2の立ち上げ

  • 1. 入れ替えたいバージョンのiptファイルを入手し、名前を変更する(導入時と同じファイル名)

    2. Tomcatを停止する

    3. 先ほどデプロイしたwebappsディレクトリからwarファイルとディレクトリを削除する

    4. Webappsディレクトリに新しいiptファイルをコピーする(デプロイ)

    5. Tomcatを開始する

    IPT2の導入

    IPT2の再インストール/アップグレード手順

    ※ ipt2を入れ替えてもデータはそのまま引き継がれますが念のためデータディレクトリのバックアップをとりましょう

  • • IPT2とは何か

    • IPT2の導入

    •基本的な使い方

    •Darwin Core Archiveの作り方

    •データ公開(publish)とデータペーパー化

    •付属資料

  • License agreement

    (チェック必須)

    データディレクトリの設定(任意のディレクトリを指定)

    ex) C:/ipt2data

    基本的な使い方

    初期セットアップ

  • 個人設定を入力(グループ利用なら個人が特定できるように。完全な個人利用なら適当でよい)

    “Test” モードを選択

    Save!

    基本的な使い方

    初期セットアップ

  • これでセットアップは完了です。

    Continueを選んで利用画面に

    基本的な使い方

    初期セットアップ

  • 基本的な使い方

    4つの基本画面

    ※ Test modeで設定したので赤いマークが出ていますが、利用上は全く問題ありません。

  • 基本的な使い方

    ログイン、ログアウト、言語の選択

    ※日本語も選択できますが、全ての画面で翻訳が済んでいるわけではないので、以降の解説も英語画面で行います。

  • • IPT2とは何か

    • IPT2の導入

    •基本的な使い方

    •Darwin Core Archiveの作り方

    •データ公開(publish)とデータペーパー化

    •付属資料

  • Darwin Core Archiveの作り方

    扱えるデータ

    •生物種の在のみデータを想定

    • csv(テキスト)ファイルになっている

    •日本語は含めず、英語で統一

    •文字コードはUTF-8で統一

    • ヘッダの項目は任意

    データのイメージ

  • Manage Resources画面

    DwC-Aの作成は、Manage Resource画面から行う

    Darwin Core Archiveの作り方

  • Shortname

    (任意で自分がわかるもの)

    Type: Occurrence(在データ)

    Create!

    Darwin Core Archiveの作り方

  • 準備した実験データを選択Addボタンを押す

    Darwin Core Archiveの作り方

  • データの基本項目をチェック“Character Encoding”は UTF-8

    Save!

    Darwin Core Archiveの作り方

  • Darwin Core Archiveの作り方

    正しく読み込まれているか確認(レコード数「● rows」)

    問題なかったらMappingsへDarwin Core Occurrenceを選択して Add

  • 手元データの項目をDwCに対応させること

    Darwin Core項目

    genus

    family

    scientificName

    手元データの項目

    Genus name

    Family name

    Species name

    MappingMappingとは?

  • 今回のデータは在データなので“occurrence”で問題ない“Save”

    Darwin Core Archiveの作り方

  • Darwin Core

    項目

    ここで手元データの項目を選択し、DwCに対応させる

    Darwin Core Archiveの作り方

    ※必須項目以外は、全て対応させる必要はない

  • 画面の最下部には、まだMappingされていない項目が表示されている。

    Darwin Core Archiveの作り方

    事前にデータ項目をDwCと同じにしておくとオートマッピングしてくれるので楽

  • 必要な項目のMappingが終わったら “Save” して “Back”

    Darwin Core Archiveの作り方

  • Darwin Core Archiveの作り方

    Mappingされた項目数が表示される「● items mapped to…」→間違いないか確認問題なければ、生物データのDwC化は完了

  • ここからメタデータ作成Metadataの“Edit” を押す

    Darwin Core Archiveの作り方

  • Darwin Core Archiveの作り方

    様々なメタデータ項目これを順次入力していく

  • 例:メタデータ項目の地理情報地図上で調査地を設定できる

    Darwin Core Archiveの作り方

    必要なメタデータを全て入力したら上のManage Resourcesボタンを押す

  • メタデータで入力したデータタイトル

    Darwin Core Archiveの作り方

    Manage Resourceトップ画面で入力したデータセットが表示される

    データセットを選択すると再び編集画面に入れる

  • 生物データのDwC化とメタデータの作成が完了!

    Darwin Core Archiveの作り方

  • その下にある “Preview”を押す

    Darwin Core Archiveの作り方

  • データセット(生物データ+メタデータ)の全体像を見ることができる

    Darwin Core Archiveの作り方

    ※ Downloadというボタンがあるが、この時点では使えない

  • • IPT2とは何か

    • IPT2の導入

    •基本的な使い方

    •Darwin Core Archiveの作り方•データ公開(publish)とデータペーパー化

    •付属資料

  • Manage Resourcesの編集画面Metadataの下にあるPublishボタン

    これを押すことで、データセットが完成してデータがインターネット上に公開される(注意:今回は個人利用なので、Publishしてもデータはインターネット上に公開されない。データセットの完成だけ)

    データ公開(publish)とデータペーパー化

  • データセットの完成以後、編集をした場合はバージョン番号が付与され、別バージョン扱いになる

    データ公開(publish)とデータペーパー化

  • 完成したデータ( DwC-Aファイルやメタデータ)はプレビュー画面からダウンロードできる

    データ公開(publish)とデータペーパー化

  • メタデータ(EML) を開いた例

    データ公開(publish)とデータペーパー化

  • RTFというボタンを押すと、メタデータをデータペーパーっぽい形式に整理したRTFファイルが取得できる

    ⇒データペーパーはこれをベースに準備

    データ公開(publish)とデータペーパー化

  • • IPT2とは何か

    • IPT2の導入

    •基本的な使い方

    •Darwin Core Archiveの作り方

    データをDarwin Core & Darwin Core Archiveに整理する

    •データ公開(Publish)とデータペーパー化

    •付属資料

  • 今回は標本等の「在」データを扱ったが、種名リストや生態学データも扱うことができる

    付属資料

  • ここから様々なDarwin Coreの拡張項目(遺伝子、画像等)を追加できる

    付属資料

  • GBIF日本ノードJBIF

    http://www.gbif.jp/v2/

    ・各種GBIF発行ドキュメントの和訳版・DwC項目の概説、フォーマットチェッカー・IPT2マニュアルの和訳版など

    付属資料

  • その他役立ちそうな情報

    ・GBIF community site, IPT interest group(http://community.gbif.org/pg/groups/3529/gbif-ipt-interest-group/)

    ・Video: How to install the GBIF IPT(https://vimeo.com/116142276)

    ・Paper from PLOS ONE【The GBIF Integrated Publishing Toolkit: Facilitating the Efficient Publishing of Biodiversity Data on the Internet】(http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0102623)

    付属資料