26
新医療統計学4 確率

新医療統計学4 - kimuakikimuakilabo.main.jp/P_Stat04.pdf条件付き確率と独立性 •条件付き確率 •他の事象Bが起こったとわかっている場合に、 事象Aの起こる確率をBを条件とするAの条件付

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

新医療統計学4確率

確率

• なぜ 統計に確率が必要なんだろう?

• 限られたデータから全体の法則性を知るためには確度の高い推量を働かせざるを得ないから

ランダムネスと確率

•統計学においては、判断はそのデータが得られる( )に基づいて行われる。

•例 トランプのマークの赤と黒を言い当てられるという人がいる。その人の能力を試した時52枚中40枚を当てたという。

•ここで40という数そのものより、40の確率論的意味が重要。

確率

• 確率probabilityに関係の深い言葉、ランダム性(ランダムネスrandomness)という語がある。

• 何が次に起こるか確定的に予想できないことを言う。

• しかし、全体としてはランダムネスに法則性がある。コインを例にすると、次に何が出るかを言い当てられぬにせよ、表と裏が半々出ることは命題として立てられる。

• ランダムネスの法則law of randomnessこれを利用するのが統計学の理論。

標本空間と事象

•統計学や確率論では起こりうる事柄を事象という。

•これは集合をつかって整理、説明される。

•例 サイコロを1回投げた場合、可能な結果possible outcomesは1.2.3.4.5.6であり、これ以外の7.8.が出ることはない。

•このように可能な結果を標本点sample pointと呼ぶ。その全体の集合を標本空間samplespaceまたは全事象と呼ぶΩであらわす。

•ここは教科書 頁69を見てみよう。

•事象eventとは標本空間の部分集合subsetで定義される。

•標本点を一つも含まず決して起こらない事象を空事象empty eventという。

•ただ一つの標本点からなり、分解できない事象を根源事象elementary eventという。

•複数の標本点を含み二つ以上の根源事象に分解可能なものを複合事象と呼ぶ。

順列と組み合わせ

•ポーカーの手

• 52C5=52!/5!47!=2.598.960

• 1枚ずつ取って並べる順列のことを考える

• K=52・51・50・49・48

•組み合わせは K/k=52・51・50・49・48/5・4・3・2・1

• n!=n(n-1)(n-2)・・・3・2・1

nPr=n!/(n-1)!

nCr=n!/r!(n-r)!

これを二項係数というbinominal coefficient

•ドモアブル

•スターリングの公式

事象の演算

• 事象は標本点の数に係わらず標本空間を長方形で表しその他の事象を内部に円を描いて表すことが行われる。

A

Ω

Ac

Ω

事象A 補事象 Ac

和事象 積事象

Union of event Intersection of event

確率の定義

•確率とは事象の起こりやすさを定量的に示すもの

•事象Aの起こる確率をprobabilityの頭文字をとってP(A)と表す

ラプラスの古典定義

相対頻度に基づく頻度説の立場、およびコロモゴロフの公理主義

ベイズ的主観確率論 という流れがある

ラプラスの定義

•確率論

パスカル ヤコブ・ベルヌーイ ド・モアブル ベイズ ダニエル・ベルヌーイ

ラプラス(1749-1827)が体系的にまとめる

試行の根源事象が全部でN それらは同程度に確からしいequally likely

この時、一つの事象Aにとって都合のよいfavorable ような根源事象

すなわちそれがでれば その事象Aの起こるような根源事象の数がR個あれば 事象Aの確率は P(A)=R/N と定義される

• 標本空間Ωが無限個の点からなる場合

• 標本に矢を射た場合、標的上のどの点においても同じくらいに当たるとして

• 当たりの確率=あたりの面積/的全体の面積

というのもラプラスの定義と同様である

>起こり方の場合の数の数え上げに帰することができる。順列・組み合わせの諸定理が使える。

•サイコロに細工がなされていなければ、

どの面も1/6の確率になることについて・・・

•これを疑う理由がないことから理由不充分の原則PRINCIPLE OF INSUFFICIENCE REASONという

頻度による確率の定義

• ラプラスの定義の限界各標本点が同様に確からしく 起こりやすいと考えられない場合には、適応できない・・・

サイコロを何回も投げて1が出る目を数えて、その割合(相対頻度)RELATIVE FREQUENCY を記録するという実験を考える、今投げる回数をNとして、1の回数をN1とすると、N1/N→1/6となることが予想される。この一般的に事象Aを生み得る実験n回を繰り返してAがnA回出るとすると、n→∞のときNA/n→α となるなるならばP(A)=αと定義する

• 極限への収束は無限に試行を続けてはじめて確認される

• 理論上確認することができない・・・

• コルモゴロフは公理を考えた・・・

A)すべての事象Aに対して0<=P(A)<=1B)P(Ω)=1C)お互いに排反な事象A1,A2,A3,・・・に対してP(A1∪A2∪A3∪・・・)=

P(A1)+P(A2)+P(A3)・・・

•この3つを公理系axiomatic definitionという

•C)は確率も測度measureは解析学の一概念で長さ、面積、体積、個数と並ぶ共通な性質を抽象化したもの

主観確率

• これまでの確率はだれが計算しても結果は同じなので、客観説objective viewの立場という

• 研究者が主観的なある確率を与えて分析を行う方法・・・主観確率subjective viewという

• この方法は、まだ起こっていないかほとんど起こってない事象、実験ごとに統計的規則が変わってしまうような事象の分析も可能になる利点がある。これはベイズの定理を用いて展開することからベイズ統計学Bayesian statistics という

加法定理

• AとBとが排反事象A∩B=Φとすると

•公理c)により

P(A∪B)=P(A)+P(B)となる

これを加法定理と呼ぶ

もし積事象が存在したら 79頁 図4.5

P(A∪B)=P(A)+P(B)-P(A∩B)

条件付き確率と独立性

•条件付き確率

•他の事象Bが起こったとわかっている場合に、事象Aの起こる確率をBを条件とするAの条件付確率conditioning probabilityと呼び

• P(A/B)=P(A∩B)/P(B)と定義する

•これを積の形に変形すれば

• P(A∩B)=P(B)・P(B/A)

独立性

• 教科書82頁 図4.7

• つぼの玉に白玉黒玉を入れて取り出す場合、

• この玉に番号1、2と記入して取り出す、

• この時の1と2の情報は、色の情報に影響されない>事象Aの起こる確率が他の事象Bに影響されない場合

• P(A)=P(A/B)である場合、この事象は独立independentという。

• この場合積事象を確率の積として表すことができるとき二つの事象は独立であるという。

ベイズの定理

• いくつかのツボに黒と白の玉が混ざっていたとしよう。いくつかの玉を抜き取ったとき、どのツボから取り出したのかという原因を知りたい。

• 一般にこのように得られた結果から原因を推定することを考える。

• A 得られた結果、H1 H2 H3 Hkを原因としよう。知りたいのはP(Hi/A)であるが、我々が知ることができるのはP( A/Hi)であることがほとんど。

• そこで、ベイズの定理を用いると、結果に対する原因の確率P( Hi/A)を計算するための公式を導くことができる。

P( Hi/A)={P(Hi)・P(A/Hi)}/

{ΣP(Hi)・P (A/Hi)}

これをP(Hi)はHiの事前確率prior probability

P(Hi/A)は事後確率posterior probabilityと呼ばれる

これは全確率の定理を用いて導くことができる。

これらの条件付確率などを基礎とする統計学的方法をベイズの統計学という。

お疲れ様 後は授業で