10
1 確率計算のための 漸化式と動的プログラミング(1) 統計数理研究所 伊庭幸人 講義の計画 A.確率計算のための漸化式と動的プログラミング 転送行列,backward-forward, sum-product, viterbiなどの逐次的な アルゴリズムのまとめとさまざまな一般化,応用について述べる. B. 情報理論再入門 情報理論のうち最も基本となる可逆な情報源圧縮について, 初歩から,MDL原理,ベイズ統計との関連まで. 今年の中央大学での講義3日目の再編集版. C.大数の法則,大偏差,カノニカル分布 確率論の初歩から統計力学との関連まで. 全体のテーマ 学んだはず?のこと,これから学ぶはずのこ と, をより高度かつ総合的な立場からみなおす ほぼ独立な3テーマを選んだ MCMC モンテカルロ関係の講義は今年度は ここではやらない 総合研究大学院大学 「計算推論科学II」 統計数理研究所(広尾) 聴講希望は伊庭まで 1月15日(月) 22日(月) 29日(月) 2月5日(月) 今日のテーマ A.確率計算のための漸化式と動的プログラミング 転送行列,backward-forward, sum-product, viterbiなどの逐次的な アルゴリズムのまとめとさまざまな一般化,応用について述べる. 絵で考えたのと,式で考えたのが, ぴったり対応させられるようになればよい はじめて聞くひとはやさしいところだけ理解すればよい 大体知っているひとは全体のつながりを再確認しよう 参考書(1) C M Bishop Pattern Recognition and Machine Learning Springer-Verlag 主に Chap.8Chap.13 グラフィカルモデル(Chap.8)はサンプルとして 著者のサイトからダウンロード可能.おすすめ.

漸化式と動的プログラミング(1)iba/kougi_2006_ism/algorithm_1st.pdf · 解析的に積分(ガウス積分) ⇒平均と共分散行列の漸化式 カルマンフィルタ

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 漸化式と動的プログラミング(1)iba/kougi_2006_ism/algorithm_1st.pdf · 解析的に積分(ガウス積分) ⇒平均と共分散行列の漸化式 カルマンフィルタ

1

確率計算のための漸化式と動的プログラミング(1)

統計数理研究所

伊庭幸人

講義の計画

A.確率計算のための漸化式と動的プログラミング 転送行列,backward-forward, sum-product, viterbiなどの逐次的な アルゴリズムのまとめとさまざまな一般化,応用について述べる.

B. 情報理論再入門 情報理論のうち最も基本となる可逆な情報源圧縮について,

 初歩から,MDL原理,ベイズ統計との関連まで. 今年の中央大学での講義3日目の再編集版.

C.大数の法則,大偏差,カノニカル分布 確率論の初歩から統計力学との関連まで.

全体のテーマ

学んだはず?のこと,これから学ぶはずのこと,

をより高度かつ総合的な立場からみなおす

⇒ ほぼ独立な3テーマを選んだ

MCMC

モンテカルロ関係の講義は今年度は

ここではやらない

総合研究大学院大学 「計算推論科学II」

統計数理研究所(広尾) 聴講希望は伊庭まで

1月15日(月) 22日(月) 29日(月)

2月5日(月)

今日のテーマ

A.確率計算のための漸化式と動的プログラミング 転送行列,backward-forward, sum-product, viterbiなどの逐次的な アルゴリズムのまとめとさまざまな一般化,応用について述べる.

絵で考えたのと,式で考えたのが,ぴったり対応させられるようになればよい

はじめて聞くひとはやさしいところだけ理解すればよい

大体知っているひとは全体のつながりを再確認しよう

参考書(1)

C M BishopPattern Recognition and Machine LearningSpringer-Verlag 主に Chap.8とChap.13

グラフィカルモデル(Chap.8)はサンプルとして著者のサイトからダウンロード可能.おすすめ.

Page 2: 漸化式と動的プログラミング(1)iba/kougi_2006_ism/algorithm_1st.pdf · 解析的に積分(ガウス積分) ⇒平均と共分散行列の漸化式 カルマンフィルタ

2

参考書(2)

S M Aji and R J McEliece (2000) 一般化分配則による統一的視点The generalized distributive lawIEEE Transactions on Information Theory, 46 pp. 325-343.

北川源四郎   連続値変数,逐次モンテカルロ法

時系列解析入門 岩波書店

樺島・上田 BPからloopy BPへ統計科学のフロンティア11 計算統計1

伊庭ほか 逐次モンテカルロ法,マルコフ連鎖モンテカルロ法

統計科学のフロンティア12 計算統計2

浅井 HMMによるゲノム解析,確率文脈自由文法(PCFG)

統計科学のフロンティア9 生物配列の統計

ベイズ統計=生成過程からのモデル化

ベイズの公式でひっくりかえす

好きな変数に既知の値(データ)を入れて,残りを確率変数だと思ってよい

MCMCなどの位置づけ

xとyを反転

ベイズの公式でひっくり返す計算のためにMCMC,逐次モンテカルロ,変分ベイズビリーフプロパゲーション viterbi などが使われる

HMM(隠れマルコフ模型)

X i X i+1

HMMを式で書くと

同時確率

事後分布

A. データ全体を与えたときの状態推定

Smoothing(平滑化)

Page 3: 漸化式と動的プログラミング(1)iba/kougi_2006_ism/algorithm_1st.pdf · 解析的に積分(ガウス積分) ⇒平均と共分散行列の漸化式 カルマンフィルタ

3

B. 時刻nまでのデータを与えたときの状態推定

Filtering(フィルタリング)

オンライン推定として重要

C.周辺尤度の計算

これから,遷移確率などのパラメータを推定する

likelihood(尤度)

問題C(尤度の計算)から考える

計算の量~ (状態の数)のN乗

計算の量~ (状態の数)掛けるN

漸化式(前向き)

1  2 1  2  3 1  2  3  4

1  2  3  4 5 6

行列記法

状態数をD ⇒ D次元行列をベクトルに演算

D=2転送行列法 (統計物理の用語)

Page 4: 漸化式と動的プログラミング(1)iba/kougi_2006_ism/algorithm_1st.pdf · 解析的に積分(ガウス積分) ⇒平均と共分散行列の漸化式 カルマンフィルタ

4

問題Bも同時に解けている

1  2  3 4 5 6

問題Aをどうするか

1  2  3  4 4 5 6 前と同じ 新しい部分

漸化式(後向き)

↑時系列から入った人は注意 赤丸は共通

グラフと式で説明すると・・

後向き漸化式の別表現 時系列解析で好まれる書き方

北川 「時系列解析入門」 岩波書店

Page 5: 漸化式と動的プログラミング(1)iba/kougi_2006_ism/algorithm_1st.pdf · 解析的に積分(ガウス積分) ⇒平均と共分散行列の漸化式 カルマンフィルタ

5

統計物理

1次元スピン系(1次元イジング鎖など)

1  2  3  4 4 5 6

対応

人間の目と蛸の目(並行進化)

タコには盲点が無い

1 2

無向グラフの描き方1

1 2 3

4

各因子(ファクター)

ごとに出てくる変数を全部繋いで完全グラフ(クリーク)にする

3

54

確率分布に限定しない

規格化を考えないほうが便利

無向グラフの描き方2

赤の対が独立でない

緑を全部固定したとき

赤の対が独立

描き方2 ⇒ 描き方1  Hammersley Cliffordの定理

描き方1 ⇒ 描き方2  ほぼ自明

条件が必要: 任意の状態について確率の値>0

参考: ファクターグラフ

1 2 3

4

1 2 3

4

1 2 3

4

一意に因子分解の形を決めない

⇒ アルゴリズムを論じるためには   より正確な表現が必要

この講義では普通の無向グラフだけですますのでやや怪しいところも出てくるかも

Page 6: 漸化式と動的プログラミング(1)iba/kougi_2006_ism/algorithm_1st.pdf · 解析的に積分(ガウス積分) ⇒平均と共分散行列の漸化式 カルマンフィルタ

6

グラフ表現の意味

ある種の条件を満たす

  「式の集合」「分布の集合」「モデルの集合」

を抜き出すフィルター

条件式のようなもの

メタモデル

高次マルコフ,第2隣接以上の相互作用

Q 次マルコフQ 隣接

状態数 D↓状態数

マルコフ場,2次元イジング 計算の手間: 「帯」が有利

断面の大きさ K 次数 D

家系図

母父 母父

子 子

確率 ⇒ メンデルの法則 詳細は「ベイズ統計と統計物理」伊庭幸人 岩波書店 2003 参照

家系図(ループなし): ツリー

Page 7: 漸化式と動的プログラミング(1)iba/kougi_2006_ism/algorithm_1st.pdf · 解析的に積分(ガウス積分) ⇒平均と共分散行列の漸化式 カルマンフィルタ

7

root

root

sum-product algorithmroot root葉から根 根から葉

行ったり来たり

「帰り」で「行き」の結果を再利用する所は似ているけれど,★★とは違うと思う.sum-productはHMMで普通使われる★の型に近い

★★

Page 8: 漸化式と動的プログラミング(1)iba/kougi_2006_ism/algorithm_1st.pdf · 解析的に積分(ガウス積分) ⇒平均と共分散行列の漸化式 カルマンフィルタ

8

家系図(ループあり)

他の方法との関係

漸化式の方法(この講義)

変分的手法平均場近似

loopy belief prop.

ある値に収束収束しても近似

マルコフ連鎖モンテカルロ(MCMC)

動き続ける無限回平均で厳密

漸化式の方法⇒ 近似分布

漸化式の方法条件付き分布からのサンプリングに使う

ループが多くても使える

有限回で終わる厳密(数値誤差以外)

D. 全部のデータを与えたときの状態のサンプリング

のサンプルを生成

宿題

状態が連続値をとる場合

一般化状態空間モデル

システム方程式       システム雑音

観測方程式          観測雑音

Page 9: 漸化式と動的プログラミング(1)iba/kougi_2006_ism/algorithm_1st.pdf · 解析的に積分(ガウス積分) ⇒平均と共分散行列の漸化式 カルマンフィルタ

9

状態が連続値をとる場合の漸化式

 和を積分で 確率を確率密度でおきかえる 積分の計算がたいへん積分を近似するより「モデル全体をHMMで近似する」と考えたほうがよいが,いずれにせよ大変

2変数  ∞×∞状態 ⇒ 2重積分2変数,2次マルコフ  ∞×∞ ×∞×∞状態 ⇒ 4重積分12次マルコフ ⇒ 12重積分

4重を100状態ずつ 100の4乗 ⇒ 1憶状態

2変数 or 1変数で2次マルコフ くらいまでなら可能 北川 「時系列解析入門」 岩波書店

問題点

1変数

2変数

or1変数2次

がとれる状態を離散化

がとれる状態を離散化より実際的な方法

 1.ガウス and 線形   解析的に積分(ガウス積分)

   ⇒平均と共分散行列の漸化式 カルマンフィルタ

 2.非ガウス or 非線形   逐次モンテカルロ法

    (パーティクル・フィルタ, GAの特殊形)   マルコフ連鎖モンテカルロ法 などを使う

   統計科学のフロンティア12 計算統計II 岩波書店

線形ガウス状態空間モデル

を状態変数に使うなどでARモデルなどさまざまなモデルを表現できる.

注意1

カルマンフィルタにも

 B.フィルタリングのほかに,

 A.平滑化,C.尤度計算,D.サンプリングが全部揃っている(原理同じ,A,Dは導出面倒)

オンラインでBを使うことが一番多いので「カルマンフィルタ」で全部を代表することが多い

カルマンサンプラー

Page 10: 漸化式と動的プログラミング(1)iba/kougi_2006_ism/algorithm_1st.pdf · 解析的に積分(ガウス積分) ⇒平均と共分散行列の漸化式 カルマンフィルタ

10

注意2

2変数の線形ガウス状態空間モデル,

    それを解く カルマンフィルタ各式は,2つの式を連立させたものになる

2状態の隠れマルコフモデル

各式は2変数の線形の式

まったく違うので注意! 2変数 ⇔ ∞×∞状態! (たとえば共分散の時間発展は非線形)