機率的意義 機率運算法則 機率分佈 二項分佈 卜瓦松分佈
第四章 . 分立機率分佈
P
機率就是長期下來事件自然發生的結果,其所佔的比例 (相對次數 )。
機率是介於 0與 1之間,其結果之機率和為 1。擲一質地均勻的骰子,若擲很多次時,則每面出現的機率為 1/6 。男女出生的比例約為 1/2 ,即為性別出現的機率。
4.1 機率的意義
11
.5 .5
00
必然發生 Certain
不會發生 Impossible
P (Event)P (A)
試驗 (experiment) :獲得一個結果 (outcome) 或簡單事件 (event) 之觀測值的過程。試驗結論的推定,主要看資料的可信度,如果可信度高其結論可靠,如果低其結論就不可靠了。機率論 (probability theory) :決定可信度高低的方法。如進行 A、 B兩種療效比較試驗,各選取 50位病人,結果 A療法有 45人治癒, B療法有 42人治癒,若說 A法比 B法好,則此推論是否可靠?
機率的意義
各種形式的統計問題,都是以機率論的原理來解釋所發生的現象。
如擲硬幣,有正面及反面兩種,若擲很多次,則可得一隨機序列 (random series) 隨機試驗。
機率的意義
HHTHTTHHTTTHHTHTT… H 或 T之 比例為 1/2 ( 機率 )
H 或 T :事件 (event) 、結果 (outcome)
Cumulative coin tosses (Cumulative coin tosses ( 累積投擲次數累積投擲次數 ))
Total headsTotal headsNumber of tossesNumber of tosses
0.000.00
0.250.25
0.500.50
0.750.75
1.001.00
00 5050 150150 200200100100
== 出現人頭的機率出現人頭的機率
隨機試驗 (random experiment) :試驗前已知所有可能發生的結果,但卻無法預知會發生何種試驗結果。而在相同情況下,試驗可重複進行。 樣品空間 (sample space) :隨機試驗之所有樣品點所形成的集合,通常以 S 表示之。
擲骰子的試驗,其樣品空間為 {1, 2, 3, 4, 5,6},而其中的 1、 2、 3、 4、 5、 6為樣品點。
事件 (event) :樣品空間的部分集合稱為事件。 如 {1, 6}為一事件。
機率基本觀念補充
SS
2244
11
66
Sample spaceSample space 樣品空樣品空間間
S: {1, 2, 3, 4, 5, 6}S: {1, 2, 3, 4, 5, 6}
Venn Diagram 范氏圖
Experiment: Experiment: 擲骰子的試驗
eventevent 事事件件
樣品點樣品點
集合的呈列
補充
55
33{1, 6}{1, 6}
加法法則 (addition rule) :a) 互斥事件 (exclusive events) :如果事件沒有共
同的樣本點,則稱為互斥事件。
4.1.1 機率運算法則
例子:丟擲一個均勻的骰子一次,出現 1或 3的機率為何?解:丟擲一個均勻的骰子,每一樣品點出現的機率皆為相等,假設 為出現 1的事件, 為出現 3的事件,則其發生的機率為:
)(AP )(BP
SS
Venn Diagram 范氏圖互斥事件 (exclusive events)
Experiment: Experiment: 擲骰子的試驗
3/16/16/1)()( BPAP
33 11
b) 非互斥事件:
機率運算法則
例子 4.1 :某班學生 50人,其中 20 歲的學生有 35人,女性學生有 30人,而女性學生中 20歲的有 21 人,則此班學生年齡為 20歲或是女性的機率有多少? 解:
42.05021)&(
6.05030):(
7.05035)20:(
BAP
BP
AP
女性歲
88.042.06.07.0
)()()()(
BAPBPAPBAP
SS
Venn Diagram 范氏圖非互斥事件
SS
SS
SS
P(A B)∪ = P(A)+P(B)-P(A∩B)
A B
A∩B A∪B
乘法法則 (multiplication rule) :• 當兩試驗同時進行,而各試驗之某事件同時發
生的機率,為兩事件獨立發生機率之相乘積。
機率運算法則
例子:某地區男女性別比為男性 0.51 ,女性則為 1-0.51=0.49 ,試問若一個家庭四個小孩皆為女性的機率為何?又若一個家庭四個小孩一個為男性的機率為何?
機率運算法則
解:設四個皆為女性的機率為 0576.0)49.0()( 4 GGGGP
而四個當中有一個為男性,則有下列幾種現象: BGGG 、 GBGG 、 GGBG 、 GGGB ,其每種現象之機率皆為
06.0)51.0()49.0( 3
所以四種現象之機率和為 4(0.06)=0.24
令 A、 B為定義於樣品空間的事件,在已知事件 B發生的條件下,事件 A發生的機率,即稱為事件 A的條件機率,其可表示為
4.1.2 條件機率Condition Probability
0)( BP)(
)()(
BP
BAP
NN
NNBAP
B
AB
)(
)()(
AP
BAP
NN
NNABP
A
AB 0)( AP
條件機率
B( 大於 3500 克 ) Bc( 小於 3500克 )
和
產婦 A ( 大於 30歲 )產婦 Ac ( 小於 30歲 )
80 20
90 10
100
100
170 30 200產婦大於 30歲,嬰兒體重超過 3500 克之機率 ?產婦小於 30歲,嬰兒體重超過 3500 克之機率 ?
例4.3 調查產婦年齡與初生嬰兒體重之現象:
隨機變數 (random variable) :隨機試驗中,出現不同結果之對應的實數值,即稱為隨機變數。
4.2 機率分佈Probability Distribution
機率分佈
擲兩枚硬幣
變數:出現正面的次數
隨機試驗
反反正反反正正正
X=0X=1X=2
1/42/41/4
隨機變數 X 機率 f(x)
隨機變數 X
隨機變數 (X) 是以整數出現,而將不同隨機變數出現的次數除以試驗總次數,即得各隨機變數唯一對應的機率。例 4.4 :同時擲三枚質地均勻的硬幣,若以正面 (H) 數為隨機變數 X ,則 X 機率分佈如下:
4.3 分立隨機變數機率分佈
Event X 機率{ TTT} 0 1/8
{ HTT,THT,TTH}
1 3/8
{ HHT,HTH,THH}
2 3/8
{ HHH} 3 1/8
表4.2
1)(0 ixf
k
iixf
1
1)(
機率分佈與相對次數不同,前者是在整個族群中穩定不變的理論,而後者隨樣品的不同而異,當樣品很大時,相對次數可能接近理論機率分佈。
分立隨機變數機率分佈
0
1/8
2/8
3/8
0 1 2 3 X
f (x)
分立隨機變數 X 之平均值 (未知資料的平均值 )即稱為期望值。定義如下:
分立隨機變數期望值為該變數可能值的加權平均,其權數為該數值出現的機率。如擲骰子很多次,每一點出現的機率應為 1/6 ,其族群平均值為:
4.4 期望值與標準偏差
k
iii xfxXE
1
)()(
1 1 1 211( ) 2( ) 6( ) 3.5
6 6 6 6
例 4.5 :設 X 為同時擲三個質地均勻的硬幣,其出現正面之次數,試求 X 之期望值 (平均值 )?
期望值與標準偏差
)( ixfx x
0123
1/83/83/81/8
03/86/83/8
合計 1
)( ixf
1
( ) ( ) 12 / 8 1.5k
i ii
E X x f x
因 為隨機變數 X 之中心值,以 表示其偏差,則變數 X 之變方,可以偏差平方的期望值求得。 隨機變數 X 之變方為:
期望值與標準偏差
X
2
2
1
2
1
222
)(
)(
)()()(
XSD
xfx
xfxXEXV
k
iii
k
iii
例 4.7:求例子 4.5 同時擲三個質地均勻的硬幣,其出現正面之次數 (X) 之變方及標準偏差?
期望值與標準偏差
75.025.23
)5.1(8/138/32
8/318/10
)(
222
22
1
222
n
iii xfx
8660.075.0)( XSD
二項分布 (Binomial distribution)
試驗結果僅有二種結果 小孩性別:男,女 擲硬幣:正,反 種子發芽:發芽,不發芽 殺蟲劑成效:死亡,存活 政策:贊成;反對 進入商店:購買;不購買 一般:成功 (S);失敗 (F)
二項分佈 (Binomial distribution)
•問題:根據過去經驗一個顧客進入 某一家商店會購買商品的機率為 0.4(40% ) ,請問三位顧客中 有二位會購買商品之機率為何? 隨機變數 X:購買商品的顧客 可能出現的值: 0,1,2,3
問題 :p(x=2)=?
補充
二項分佈 (Binomial distribution)
問題特性:1.本試驗包括三個相同的小試驗 每一小試驗是顧客購買商品2.每一小試驗只有二種結果 購買 (S) 或不購買 (F)3.P(S)=0.4; P(F)=1-P(S)=0.64. 每一個顧客買的機率均為 0.45. 每一個顧客均獨立購買商品 (不受他人影響 )
二項分佈 (Binomial distribution)
樣品空間
X=2 之事件包含的結果為 { SSF,SFS,FSS}
SSS FFS
SSF FSF
SFS SFF
FSS FFF
二項分佈 (Binomial distribution)
P(SSF)=P(S)P(S)P(F)=(0.4)(0.4)(0.6)=(0.4)20.6
P(SFS)=P(S)P(F)P(S)=(0.4)(0.6)(0.4)=(0.4)20.6
P(FSS)=P(F)P(S)P(S)=(0.6)(0.4)(0.4)=(0.4)20.6
P(X=2)=P(SSF)+P(SFS)+P(FSS)
=(0.4)20.6+(0.4)20.6+(0.4)20.6
=3(0.4)20.6=0.288
1. 0.4 為顧客購買商品之機率= p2. 0.6 為顧客不購買商品之機率= q= (1-p)3. 3 為 X=2 事件包含結果之個數 即 3位顧客中有兩位顧客會 購買商品的可能組合 SSF→第一位,第二位 SFS→第一位,第三位 FSS→第二位,第三位4.
2 2( 2) (0.4) (0.6) 3(0.4) (0.6) 0.288P x
3
2
二項分布 (Binomial Distribution)
1. 試驗包括 n個相同小試驗2. 每個小試驗包括二個結果成功 (S) 或失敗 (F)3. 成功機率為 p, 失敗機率為 q=1-p4. 小試驗間為互相獨立5. X為成功次數6. !
( )!( )!
x n x x n xn nP x p q p q
x x n x
二項族群之平均值與變方
例如一個二項族群觀測值僅有五個如下 0,1,0,1,1( 如 1代表贊成 ,0代表反對 ) N=5
族群平均值 :
族群變方 :
(0 1 ... 1) / 5 3/ 5 0.6 p
2 2 2 2 2(0 1 ... 1 3 / 5) / 5 1.2 / 5 0.24 0.6 0.4
(1 )p p p q
二項族群之樣品平均值與變方如從一個二項族群 0,1,0,1,1,0,1,… 中隨機抽取四個觀測值為一樣品如下 :
0,1,0,1( 如 1代表贊成 ,0代表反對 ) n=4樣品平均值 : 樣品平均值變方 : (注意 :0.6 在前 ,0.4 在後 )
樣品平均值變方估值 :(注意 :0.4 在前 ,0.6 在後 )
_
(0 1 0 1) / 4 2 / 5 0.4x p
_
2_2 0.6 0.4
( ) 0.064x
pqV x
n n
_
22 0.4 0.6
0.064x
p q
n n
二項分佈 (Binomial Distribution)
二項分布樣品和 (T= ) 之期望值與變方 成功機率為 p,其二項分立隨機變數,記以 X~B(n,p )
若 p 未知 ,則以其估值 代替
ix
2
4 0.6 2.4
4 0.6 0.4 0.96
0.96 0.98
T
T
T
np
npq
npq
p
[例 ]有一醫學試驗進行某新藥品對某疾病的治療效果,我們希望新藥品治癒率達 90%,(無效率為 10%)。今試驗 20位病人,若其治癒率可靠,則應有多少病人治癒?而最多有 15位病人治癒之機率為多少?
由二項分布期望值公式,其治癒人數為: E(X)=np=20(0.9)=18人
而最多有 15位病人治癒之機率可利用二項分布累計機率公式求得:
至少有 16位病人治癒的機率為:
15
0
1520
0
( 15) ( )
200.9 0.1
0.0432( )
x
x x
x
P X f x
x
( )( )
附表二
( 16) 1 ( 15)
1 0.0432
0.9568
P X p X
[例 4.10] 有一健保意見調查,若設 80%居民 贊成,今獨立隨機訪問 15位居民, 8 個以上居民贊成之機率為多少?有 10 個至 14 個居民贊成之機率有多 少?(1)至少有 8位居民贊成之機率為 Pr(X≧8)=1-Pr(X≦7) 今 n=15, x=7, p=0.8 查附表 2得 Pr(X ≦7)=0.0042
二項分布 (Binomial Distribution)
故至少有 8位居民贊成之機率為 1-0.0042=0.9958
(2) 有 10至 14 位居民贊成之機率為
Pr(10≦X≦14)
=P(X≦14)-P(X≦9)
=0.9648-030611=0.9037
卜瓦松分布 (Poisson Distribution)
卜瓦松分布為稀少事件個數之分布 二項分布中 n很大且 p很小時,其分布即變成 卜瓦松分布 例:十字路口車禍之次數 騎兵被馬踢死之人數 中正機場塔台發生錯誤的次數 一 c.c.血液中某種細菌之個數
卜瓦松分布 (Poisson Distribution)
機率公式
μ為卜瓦松分布之平均‧卜瓦松分布之特性 μ=σ2
( )!
xep X x
x
不同之卜瓦松分布圖
例:某醫院經過幾年的調查統計,平均一天有 2位車禍病人求診,若車禍病人屬卜瓦松分布,試求一天多於 3位車禍病人求診之機率。
μ= 2, 車禍病人 x = 0,1,2,3 之機率如下表
卜瓦松分布機率求法
完全沒有車禍病人之機率只有 13.534%, 有一個車禍病人之機率為 27.067 %, 有二個車禍病人之機率為 27.067 %,而有三個車禍病人之機率為 18.045%,大於三個車禍病人之機率為: P(X > 3)=1-p(X≦3)=1-0.85713 =0.14287=14.287%
例:設在高速公路上平均每天有 5次車禍發生,若 x為某天 發生車禍之隨機變數,求下列各項機率:(a) 沒有車禍發生(b) 少於 3次車禍(c) 多於 3次車禍高速公路來往車輛很多,平均一天發生 5次車禍應屬於卜瓦松分布,故上述各項機率為:
(a)
(b)
=0.00674+0.03369+0.08422+0.14037 =0.26502=26.502%(c) P(X > 3)=1-P(X≦3)=1-0.26502=0.73498=73.3498%
05 5
( 0) 0.00674 0.674%! 0!
x
p X e ex
0 1 2 35 5 5 55 5 5 5
( 3)0! 1! 2! 3!
P X e e e e
The End