Upload
others
View
3
Download
0
Embed Size (px)
Citation preview
マテリアルズ・インフォマティクス分野の特色と課題
北陸先端科学技術大学院大学DAM Hieu Chi
Outline
イントロ マテリアルデータ & マテリアルズ・インフォマティクス
材料の構造記述子とそれを基にした演算 事例と考察
結論
マテリアルズ・インフォマティクス
✦ 2011: Materials Genome Initiative (MGI) White Paper $250 Million in new R&D MGI
✦ 2011-2014: Fact Sheet - Three years of Progress ✦ 2014: MGI Strategic Plan
マテリアルズ・インフォマティクス∞ 目標・期待 ∞
既存材料の理解
新規材料の探索・設計
実験 計算機実験
仮説の提示データの可視化
データ
デー
タ科
学デ
ータ
科学
マテリアルサイエンス
&インフォマティクス
&
マテリアルズインフォマティクス
データの記述
10 20 30 40 50 60 70 80
x 5
テキストマイニング 自然言語処理
バイオインフォマティクス
画像処理
マテリアル サイエンス
材料の記述
第一原理計算
物質の構造モデル{Zi, Ri}
HamiltonianH(V, N)
電子状態物性値
シュレーディンガー方程式
ψ材料の記述
計算コスト
逆推定が困難
【視点】
知能処理の最も素朴な処理は任意に与えられた2つ以上の情報表現が等価(同等)であるかどうかを決定する操作(単一化操作)である
演算の装備が粗末
識別能力なし?
類似度評価(注目対象に依存)
(多変量)
第一原理計算と計算機実験データ
物質の構造モデル{Zi, Ri}
HamiltonianH(V, N)
電子状態物性値
シュレーディンガー方程式
ψ材料の記述
特定の物質群の計算データに対して機械・統計学習の適用が有望
機械・統計学習と第一原理計算の融合
機械・統計学習向けたデータの記述方法が必要
まとめ (1)
マテリアルズインフォマティクスの特徴:
1. マテリアルの記述が簡単のようで難しい
2. 算計算機実験によるデータ収集が可能
Outline
イントロ マテリアルデータ & マテリアルズ・インフォマティクス
材料の構造記述子とそれを基にした演算 事例と考察
結論
マテリアルズ・インフォマティクス∞ データ科学への期待 ∞
各物性値情報
構造情報 格子定数 各原子の座標 対称群 セルチョイス
各測定の生データ
合成条件情報
化学組成情報
第一原理計算構造解析(経験・
自動最適化)
逆問題
データ科学
各物性値予測情報
天才的材料設計(経験・暗黙知)
経験的予測
対応関係の期待
データ科学
データ科学
データ科学
データ科学?
経験的予測
順問題
記述子
逆問題
データ科学への期待:予測精度と新たな知識・洞察の獲得
材料データに対して如何にデータマイニング手法を適切に活用するか?
(結晶・アモルファス etc.)
構造情報 格子定数 各原子の座標 対称群 セルチョイス
各物性値情報
各測定の生データ
合成条件情報
化学組成情報
マイニングマテリアルデータ材
料の
デー
タ
特徴量ベクトル(x1, x2, …, xm)
記述子による表現
物性値予測
新たな知識
線形モデル全エネルギー
サポートベクトルマシン
混合線形モデル
ガウス過程
ニューラルネットワーク
予測解析
磁気モメント
磁気相転移温度
非線形回帰による変数組み合わせ選択
Graphical LASSO
線形・非線形次元削減
特徴量間相関構造(線形・非線形相関)
潜在変数抽出
y=f(x1, x2, …, xm)
x1
x2
xm x3
xk
記述解析
新たな知識・洞察
応用性
離散的情報→関数として知識化解析的な探索・解析が可能
構造物性相関構造を整理・可視化
構造情報 格子定数 各原子の座標 対称群 セルチョイス
各物性値情報
各測定の生データ
合成条件情報
化学組成情報
マイニングマテリアルデータ材
料の
デー
タ
特徴量ベクトル(x1, x2, …, xm)
記述子による表現
材料の構造記述子 (1)
不変性
- 並進・回転の不変性
- 同種原子入れ替えの不変性
- 結晶単位構造の取り方の不変性
情報量の制御
- 完全性 (解析の目的のために十分な情報を担保する)
- 単射性 (別の二つの構造が異なった記述ベクトルに写像される)
構造に逆変換・推定可能
- 最適化された記述子の情報を基にして,設計するべき材料の構造を推定できる
物理化学の意味付け可能
- 記述子で記述されるデータから得られる知識や洞察が既存の物理化学の知識表現で説明できる
記述子の必要条件 望ましい性質
構造情報 格子定数 各原子の座標 対称群 セルチョイス
材料の構造記述子:原子座標の集合
格子定数各原子の座標
不変性
情報量の制御
構造に逆変換・推定可能
物理化学の意味付け可能
8>>>>><
>>>>>:
a, b, c, ↵, �, �
atom1, x1, y1, z1
atom2, x2, y2, z2...
atomn, xn, yn, zn
9>>>>>=
>>>>>;
高度演算が可能
材料の構造記述子:原子座標の集合
8>>>>><
>>>>>:
a
A, b
A, c
A, ↵
A, �
A, �
A
atom
A1 , x
A1 , y
A1 , z
A1
atom
A2 , x
A2 , y
A2 , z
A2
...atom
An , x
An , y
An , z
An
9>>>>>=
>>>>>;
8>>>>><
>>>>>:
a
B, b
B, c
B, ↵
B, �
B, �
B
atom
B1 , x
B1 , y
B1 , z
B1
atom
B2 , x
B2 , y
B2 , z
B2
...atom
Bm, x
Bm, y
Bm, z
Bm
9>>>>>=
>>>>>;
物質A 物質B集合の代数
6=\[ ⌘
OganovらのUSPEX
1. 無理矢理な構造演算の実行
2. 第一原理計算による構造の修正
+
構造の演算成功事例
材料の構造記述子
自然言語
文書のような表現
画像のような表現
経験による特徴量
...
マテインフォ独自
Chemo-informaticsO1C=C[C@H]([C@H]1O2)c3c2cc(OC)c4c3OC(=O)C5=C4CCC(=O)5
密度汎関数法画像処理技術
深層学習?
従来のやり方次元削減
スパースモデリング
材料の構造記述子:原子環境の集合
8>>>>>>>>>><
>>>>>>>>>>:
a, b, c, ↵, �, �
atom1, x1, y1, z1
atom2, x2, y2, z2...
atomi, xi, yi, zi...
atomn, xn, yn, zn
9>>>>>>>>>>=
>>>>>>>>>>;
原子座標の集合
Atom i
Rij
Atom j
Atom k
Rik
↵jik
Atom i
Rij
Atom j
Potential
RadiusRij
G(R)
Potentialfunction
Distributionfunction
Equipotential
Etwo�body
i
=
Z 1
0G(R)P
i
(R)dR
⇡X
atomi2Rc
G(Ri
)
8>>>>>>>><
>>>>>>>>:
atom1, (x11, · · · , xm
1 )atom2, (x1
2, · · · , xm2 )
...atomi, (x1
i , · · · , xmi )
...atomn, (x1
n, · · · , xmn )
9>>>>>>>>=
>>>>>>>>;
Behler et al., PRL 98, 146401 (2007); Atsuto Seko, et.al. PRB 90, 024101 (2014) Albert P. Barto k and Mike C. Payne, PRL 104, 136403 (2010)
原子環境の集合
材料の構造記述子:原子環境の集合
8>>>>>>>>>><
>>>>>>>>>>:
a, b, c, ↵, �, �
atom1, x1, y1, z1
atom2, x2, y2, z2...
atomi, xi, yi, zi...
atomn, xn, yn, zn
9>>>>>>>>>>=
>>>>>>>>>>;
原子座標の集合
8>>>>>>>><
>>>>>>>>:
atom1, (x11, · · · , xm
1 )atom2, (x1
2, · · · , xm2 )
...atomi, (x1
i , · · · , xmi )
...atomn, (x1
n, · · · , xmn )
9>>>>>>>>=
>>>>>>>>;
不変性
情報量の制御
構造に逆変換・推定可能
物理化学の意味付け可能
高度演算が可能
原子環境の集合
結論
マテリアルズ・インフォマティクス
計算機シミュレーション ➼ 計算機実験データ
記述子の設計 → 記述子の学習 ➼ 知識リーチなデータの記述
データマイニング・機械学習 ➼ 知識抽出
… + 人間の閃きとの共創