Upload
others
View
2
Download
0
Embed Size (px)
Citation preview
DNA鑑定を理解するために必要な数学の学び方
法数学勉強会6月特別会(2017)平成29年6月7日長良川国際会議場
45分?
法数学
「オトナ 数学」で検索
これさえ読めば、DNA鑑定のための数学の基礎は身につく!• アマゾンで検索!
確率・統計 (理工系の数学入門コース7)
1989/2/8古くても大丈夫!でも、「理工系」の確率統計と法数学は違う
大学の一般教養の確率統計は『一般的』過ぎる
「リスク」「株」「経済統計」「保険の数学」
法数学によいことが多い
何がわかればよいのか?•過去の法数学勉強会の内容がわかれば
•もう、法数学の最先端
•まともな教科書もない世界なのですから
これまでの法数学勉強会では…• 尤度・尤度比
• ベイズ推定
• ベイジアンネットワーク
• 否定するかしないか
尤度• とても大事• これさえ解れば、後はいらないかも知れないくらい大事
• 「尤度とは」という本は(基本的に)は
ない
尤度とは• 法数学を含め、「データを使って何かを考える分野」で、使いまわされる、何か
• 「 とは何か」みたいなもの• とても基礎的で、それなしにはデータについて考えられないようなもの
尤度とは「 」のようなものなので• たいていの統計確率、データサイエンスの教科書(の冒頭)に少しだけ書いてある。
• たいていの統計確率、データサイエンスの教科書では、そこで説明した「尤度」を、その本の目的のために使っている
本を買って読むなら、「尤度」の説明だけを読んで、それ以外は読まずに終えよう。もし、1冊選ぶなら、その「尤度」の説明の章・節が『自分にとって』わかりやすいかどうかで選ぼう
尤度比はどうする?• 2x2表を使った臨床診断での説明から入る、と言うやり方は「アリ」
• 「確率統計」に疎い医療系読者を想定しているから
• ただし、法数学のために読む人は、「尤度」「尤度比」という単語を使っている本をみつけないといけません!
• アマゾンでは、見つからないかもしれません。• なぜか• 「本」にするには「既定路線」で説明することが求められ、臨床診断の「既定路線」では「尤度・尤度比」を使うことが主流ではないから
「感度 特異度 尤度 尤度比」で検索
尤度比 もう1つの道• 遺伝カウンセリング
• もちろん、関係ない内容が山ほどあるので、該当する部分だけつまみ食いするべき
DNA鑑定のための最尤推定~離散型から連続型へ、シフトしよう~
• 尤度比を考えているときは、「どちら」の尤度が高いか、を問題にする
• たくさんの仮説がある場合は、「どの」尤度が高いか、を問題にする
• 「どちら」「どの」も「あれか・これか」の離散型• 離散型である場合でも「最尤推定」は「できる」けれども、考えてもメリットがない
• 最尤法は連続型が気になるときのために活躍する
DNA鑑定のための最尤推定~離散型から連続型へ、シフトしよう~
• STRマーカーのアレル頻度の最尤推定問題を丁寧に勉強しよう• データは離散、推定するのは連続
• 基礎から• 「あり」「なし」:2通り、離散• 「ありの割合:0 ~ 1 の連続値
• N回リピート、N+1回リピート、N+2回リピート:3通り、離散• 「N、N+1、N+2」の割合:(p, q, r)の連続値
「あり」「なし」データからの「あり」の割合の「最尤推定」• これをとことん勉強しよう
• 「あり」「なし」:2通り、離散• 「あり」の割合:0 ~ 1 の連続値
• 大事なポイントは、0 ~ 1 の値のどこを取るかわからないけれど、「最も尤もらしい値」を見つける、ことを理解する
• 基本的過ぎて「良い本」が少ないが、「最尤法」を扱った本の「冒頭の例」として出てくることは多い
拡張する• 二項分布、ベータ分布
• 「あり」「なし」:2通り、離散• 「ありの割合:0 ~ 1 の連続値
• 多項分布、ディリくれ分布• N回リピート、N+1回リピート、N+2回リピート:3通り、離散• 「N、N+1、N+2」の割合:(p, q, r)の連続値
• この『拡張』はそれほどメジャーな話ではないので、資料がなかなか見つけられないことを覚悟しよう
• 『共役分布』という単語も勉強しないといけなくなる
最尤推定(点推定)から分布推定• データから何かを推定するときに、「点推定」と「区間推定」とがあることも大事
• またまた「基本」なので、「本」の冒頭に書かれているだけ
• 「統計」「統計解析」の推定の本は選ばずに、「ベイズ推定」と名乗っている本の「冒頭の推定の基本」のところを勉強しよう
• なぜなら、ベイズ推定以外の「統計」「統計解析」の「推定」を読むと、混乱すること、必至なので
ここまでで、何を?• 高校までの数学• 尤度• 尤度比• 最尤法とそのための、連続値変数• DNAマーカーを扱うための
• 二項分布・多項分布• ベータ分布・ディリクレ分布• それらを理解するための分布の共役関係
• 点推定・区間推定・分布推定:ただしベイズ流
あとは、何を?• 確率モデル
• 複雑になったときのためのベイジアンネットワーク
• 統計でも尤度でもベイズでもないこと。それは決断
確率モデル• 最尤法とそのための、連続値変数
• この「連続値変数」というのが、確率モデルの中心
• 何かしらこういう変数を使って、データが出てくる仕組みを「モデル」にする
• ベイズ流に考えているときは、必ずこの「モデル(確率モデル)」がある
めずらしく、お勧めの本
ベイジアンネットワークが学びたいヒトへ• ベイズ だけど ベイズの定理の拡張でわかろうとしないで
鈴木/譲1993年早稲田大学理工学研究科修了。1995年早稲田大学理工学部助手。大阪大学大学院理学研究科助教授。現在、大阪大学大学院理学研究科准教授・博士(工学)
植野/真臣1994年東京工業大学総合理工学研究科。東京工業大学総合理工学研究科助手。2000年長岡技術科学大学工学部助教授。2006年電気通信大学大学院情報システム学研究科助教授。現在、電気通信大学大学院情報理工学研究科教授・博士(工学)
決断は 確率・統計・ベイズ ではない• 確率を使わないタイプの決定理論• 哲学・経済学・政治学・心理学・計算機科学・統計学
DNA鑑定のための数学• 高校までの数学• 尤度• 尤度比• 最尤法とそのための、連続値変数• DNAマーカーを扱うための
• 二項分布・多項分布• ベータ分布・ディリクレ分布• それらを理解するための分布の共役関係
• 点推定・区間推定・分布推定:ただしベイズ流• 確率モデル• ベイジアンネットワーク• 決断
Kindle ryamada で検索DNA鑑定のための数学• 高校までの数学• 尤度• 尤度比• 最尤法とそのための、連続値変数• DNAマーカーを扱うための
• 二項分布・多項分布• ベータ分布・ディリクレ分布• それらを理解するための分布の共役関係
• 点推定・区間推定・分布推定:ただしベイズ流• 確率モデル• ベイジアンネットワーク• 決断
• 法数学勉強会@京大要録 2010年8月-2013年6月
• ジェノタイプ推定で学ぶベイジアンネットワーク
• 事後分布推定• DNA鑑定のための区間推定• 。。。ほか
ただし、「購入」しなくても大丈夫。http://d.hatena.ne.jp/ryamada22/20141222
に、「無償版」があります。http://statgenet-kyotouniv.wikidot.com/handouts-slides
過去の法数学勉強会のスライドはこちらから取れます。