ビッグデータ時代のインベントリー利活用プラットフォーム
国立研究開発法人農業環境技術研究所
農業環境インベントリーセンター
大澤 剛士<[email protected]>
2016年2月24日 第6回農業環境インベントリー研究会エポカルつくば
コンテンツ
• NIAES VIC
•
•
•
コンテンツ
• NIAES VIC
•
•
•
農環研の情報資産
http://www.niaes.affrc.go.jp/techdoc/db_image.html?ref=top0
多種多様なデータベース情報資産=インベントリー
~全国的な土壌、気象、生物、土地利用、衛星画像、農業統計などの農業環境情報を一元的に提供できる農業環境情報統合データベースを構築する。
農環研 第三期中(長)期計画(FY2011-2015)
農業環境情報統合データベースの開発
農業環境情報統合データベースNIAES VIC (Virtual Inventory Complex)http://dc.niaesvic.affrc.go.jp
第三期中長期計画の成果物(年度末公開)
CKANカタログサイト
農業環境資源を検索アクセス、取得の補助
農業環境情報統合データベースNIAES VIC (Virtual Inventory Complex)http://dc.niaesvic.affrc.go.jp
Webシステムの検索
データセットの検索ダウンロードサービス
仮想的な統合の実現
農業環境情報統合データベースNIAES VIC (Virtual Inventory Complex)http://dc.niaesvic.affrc.go.jp
API(インターネット経由でデータに直接アクセスする仕組み)の実装
自由な利用の保証(原則CC-BY)オープンデータの推進
農業環境情報統合データベースNIAES VIC (Virtual Inventory Complex)http://dc.niaesvic.affrc.go.jp
• NIAES VIC
•
•
•
情報のビッグバン
1年間に約3ゼッタバイトのデータが生成キロ < メガ < ギガ < テラ < ペタ< エクサ < ゼッタ
これは全世界で1人あたり約400GBに相当
巨大データの時代
容量の心配は(ほぼ)不要目的に応じてデータベースを構築
『●●統合データベース』
いわゆる「データ統合」
『●●統合データベース』
いわゆる「データ統合」
一つの“箱”の中にありとあらゆるデータを入れる
どこかにあるんだけどどこにあるんだよ・・・
本来、仕事を便利にしてくれるはずのDBが足かせになってしまう!
ありがちな問題
方向を間違えたり、やり過ぎたりしない
ようにするには、
まず「本当は重要でも何でもない」1000の
ことにノーと言う必要がある
スティーブ ジョブス(1955-2011)
統合データベース
全てのデータを規格化同じデータベースに格納
NO!
クラウドコンピューティング=インターネット技術
データベースを雲の中に放り込み、処理は機械に任せてしまう。ユーザはインタフェースを介して欲しいデータを呼び出すのみ!
由来が異なるデータを無理に規格化し、”結合”する必要はない!
・ 既存のデータベースは、既存の状態=独立で保持(管理)、拡充
・ ただし、緩やかに連携させる・全てのデータベースを雲に放り込む。データの性質は簡単に把握できるようにする
metadata
metadata
metadata
metadatametadata
webAPI
webAPIwebAPI
webAPI webAPI
・ データにアクセスする窓口(API)を取り付け、自由にアクセス可能にする
metadata
metadata
metadata
metadatametadata
・ そのときにニーズに応じてインタフェースを開発し、横断利用コンテンツをつくる。
気象+土壌温室効果ガスの発生量を予測
・ コンテンツは役割を果たした後に廃止でもデータは維持され、再利用可能
・ 新たなデータベースは追加していく=雲の中に放り込んでいく
再利用・拡張の自由
農業環境資源を検索アクセス、取得の補助
農業環境情報統合データベースNIAES VIC (Virtual Inventory Complex)http://dc.niaesvic.affrc.go.jp
Webシステムの検索
データセットの検索ダウンロードサービス
仮想的な統合の実現
農業環境情報統合データベースNIAES VIC (Virtual Inventory Complex)http://dc.niaesvic.affrc.go.jp
API(インターネット経由でデータに直接アクセスする仕組み)の実装
コンテンツ
• NIAES VIC
•
•
•
Q.ネット上に氾濫する情報その著作権を考えたことはありますか?
著作権法の原則:著作者の許諾なしに創作物を利用してはいけない!
著作権への意識
ライセンスによって許諾条件を明確化する(商用不可、再配布不可、著作者明記etc..)
ライセンス
著作権法の原則:著作者の許諾なしに創作物を利用してはいけない!
知財を保護しつつ、社会に還元できる適切なライセンスを付与すべき
ライセンス設定
我々の研究成果=税金が主な原資研究成果、情報資源
法律知識を持たない非専門家による設定には限界がある
ライセンス設定商用の範囲?
教育用は?NPOが使う場合?
内部利用は?
印刷物では?
国外利用は?
Open Dataオープンデータ
誰でも自由に利用、加工、配布が可能
コンテンツ
• NIAES VIC
•
•
•
Open Dataオープンデータ
誰でも自由に利用、加工、配布が可能
・政府情報は原則としてオープンデータ・質と量を担保するべし・すべての者が利用できるように・自由に使って新しいものを生もう
G8で合意
ガバナンス改善、イノベーションのため政府データの公表を促進すべし!
公的研究機関として従うべき考え
オープンデータ憲章
クリエイティブ・コモンズ
標準ライセンス
国際NGOによって提案されたライセンスオープンデータライセンスとして利用可能
標準ライセンス
必要条項が組み込まれたものが利用可能自身でライセンスを設定しないで済む
自由な利用の保証(原則CC-BY)オープンデータの推進
農業環境情報統合データベースNIAES VIC (Virtual Inventory Complex)http://dc.niaesvic.affrc.go.jp
http://www.data.go.jp/
日本政府のオープンデータ
政府発表や統計情報を中心に様々なデータをオープン化
CKANカタログサイト
農業環境情報統合データベースNIAES VIC (Virtual Inventory Complex)http://dc.niaesvic.affrc.go.jp
第三期中長期計画の成果物
CKANカタログサイト
NIAES VICは同じシステム
政府オープンデータとの横断利用が容易分野横断的な利活用が期待される
CKANカタログサイト
まとめ
• NIAES VIC
•
•
カタログサイトは「箱」に過ぎません。最も重要なのは、格納されたデータです
「100年前から受け継いだインベントリーを150年後も使えるようにすること」
組織再編後も、この役割は決してなくなりません
Take Home Message