Upload
others
View
12
Download
0
Embed Size (px)
Citation preview
統計学 補足文書
1
7. 離散的確率変数
1. 離散的確率変数と連続的確率変数
これ以降は,テキスト p.75 ~ の補足である。補足の内容は,高校数学 B の「確率分布と統
計的な推測」とほぼ同じである。用語・定義・公式をよく理解すること。
確率変数 X の定義
(1) 確率変数 X 試行T の結果(標本点)に対して値が定まる変数 X を,試行T における「確率変数」
という。 X がとる値を, X の実現値という。確率変数は,通常, ZYX ,, などの大文
字で表す。
(2) 離散的確率変数 X がとびとびの値しかとらないとき,X は離散的(離散型)である,または,X は離
散的確率変数であるという。 X が整数値しかとらない場合,あるいは, X のとり得る値
が有限個の場合は,X は離散的である。試行T の標本空間Ωが有限集合の場合は,X の
とり得る値は有限個になるので, X は離散的である。
(3) 連続的確率変数 X が,ある区間内のすべての実数値をとり得るとき, X は連続的(連続型)である,
または, X は連続的確率変数であるという。
例1(離散的確率変数)
1 個のサイコロを 1 回投げるという試行T を行い,出た目の数を X とする。
1 の目が出たら 1=X ,すなわち X のとる値(実現値)は 1
となる。同様に,2 の目が出たら 2=X ,3 の目が出たら 3=X ,… となる。試行T の結果
に対して X の値が定まるので, X は確率変数になる。 X のとり得る値は, 6,5,4,3,2,1=X であり,1 の次は(飛んで)2 である。X は 1.2356のような値をとらない。 X はとびとびの値しかとらないので,離散的である。 例 2(連続的確率変数)
紙テープを目分量で 5cm の長さに切り取るという試行T を行い,切り取られたテープの長さ
を X cm とする。試行T の結果(切り取られた紙テープ)に対して X の値が定まるので,X は
確率変数になる。X の実現値はおよそ 5cm 前後であるが,X は 5cm 前後のすべての実数値を
とり得る。 X が 5.123456cm のような値をとっても,おかしくはない。従って, X は連続的
である。
統計学 補足文書
2
連続的な確率変数の話になると積分が登場するが,統計入門の段階では,それらは無視する
か,直感的に理解すればよい。まずは,離散的確率変数をよく理解すること。 2. 離散的確率変数
離散的確率変数 X
(1) X の確率分布 試行T の結果によって,確率変数 X のとり得る値が nxxx ,,, 21 であり,X が ixをとる確率が
)( ii xXPp == ( ni ,,2,1 = )
であるとき, ix と ip との対応関係を,「 X の確率分布」または単に「 X の分布」という。
また,確率変数 X はこの分布に従うという。
(2) X の確率分布表 X の確率分布を示した次の表を, X の確率分布表という。
… 計 … 1
次が常に成り立つ。 121 =+++ nppp (確率の合計は 1 )
(3) X の確率関数 )()( xXPxp ==
上記では, X のとり得る値が有限個なので, X は離散的確率変数である。以下をよく理解
しよう。
(1) 上記の確率は,次の意味である。実数 a に対して,「 X が a の値をとる」という事象を
aX = で表し,この事象の確率を
)( aXP =
で表す。これを,「 aX = となる確率」「 X が aの値をとる確率」という。
(2) もう少し詳しく説明しよう。試行T の標本空間をΩとする。確率変数 X は,Ωの要素(す
なわち標本点)に対して値が定まる変数である。標本点ωに対して定まる X の値を )(ωX で
表せば,事象 aX = とは,集合
)(| aXA =Ω∈= ωω
のことである。すなわち,実現値が a となる標本点全体の集合が A である。この事象 A の
確率 )( AP が )( aXP = である。
X 1x 2x nx
P 1p 2p np
統計学 補足文書
3
実数 a が X の実現値でなければ, φ=A となり, 0)( == aXP となる。
(3) 同様に,「 X が a 以下の値をとる」という事象 aX ≤ の確率は
)( aXP ≤
で表され,「 X が a 以上 b 以下の値をとる」という事象 bXa ≤≤ の確率は
)( bXaP ≤≤
で表される。
(4) 任意の実数 に対して )( xXP = の値が定まるので, )( xXP = は x の関数になる。
)()( xXPxp ==
とおき, )( xp を X の確率関数という。この関数を, X の確率分布と呼ぶこともある。
(5) X の実現値が有限個なので,次の①②が定まる。
① X のとり得る異なる値 :
② X が ix をとる確率 : )()( iii xXPxpp === ( ni ≤≤1 )
ここで,試行T を行ったとき, X が nxxx ,,, 21 のいずれかの値をとる確率は,
nppp +++ 21
である。一方, X は nxxx ,,, 21 のいずれかの値を必ずとるので,次が成立する。
121 ==+++ ∑i
in pppp
また, の確率分布は,次の表の形で表すこともできる。これを X の確率分布表という。
… 計 … 1
(6) X の確率分布とは,実現値 ix と確率 )( ii xXPp == との対応関係のことであり,これ
を表で示したものが確率分布表である。対応関係は,確率関数 )()( xXPxp == でも示さ
れる。従って, X の確率分布を求めよという問題に対しては,確率分布表または確率関数を
求めればよい。
(7) 離散的確率変数 X においては, X の確率関数 )( xp を求めることと, X の確率分布表を
求めることとは同じ意味になる。 例1
1 個のサイコロを 1 回投げるという試行T に対して,出る目の数を X で表す。
(1) 試行T の標本空間は 6,5,4,3,2,1=Ω である。
(2) X のとり得る異なる値は 6,5,4,3,2,1 である。
(3) X が 1 の値をとる確率(サイコロを投げて 1 の目が出る確率)は, 6/1)1( ==XP
x
nxxxx ,,,, 321
ip
X
X 1x 2x nx
P 1p 2p np
統計学 補足文書
4
(4) 他の確率も同様なので, X の確率分布は次のとおり。(確率の合計は必ず 1)
1 2 3 4 5 6 計 1/6 1/6 1/6 1/6 1/6 1/6 1
(5) X が 3 以上 5 以下の値をとる確率は
)5()4()3()53( =+=+==≤≤ XPXPXPXP
21
61
61
61
=++=
(6) X の確率関数は
61)()( === xXPxp ( 6,,2,1 =x )
(7) )( xp をグラフで表すと,以下のようになる。この分布では, X の実現値に対して,その
確率がすべて 1/6 となり等しい。このような確率分布を「一様分布」という。
1 2 3 4 5 6x
p (x)
61
例2
白玉 2 個と黒玉 3 個の入った袋から,3 個の玉を同時に取り出すとき,出る白玉の個数を Xとする。 X の確率分布を求めよ。 <解>
3個を同時に取り出す
3 個の玉を同時に取り出すという試行を行うと,X の値が定まるので,X は確率変数である。 袋には白玉は 2 個しかないので, X のとり得る値は,0,1,2 である。 袋から 3 個の玉を同時に取り出す方法は,
101245
2535535 =××
=== − CCC (通り)
0=X となる場合は,袋から 3 個の黒玉をとった場合であるから,その場合の数は 1 であ
る。従って,
XP
統計学 補足文書
5
101)0( ==XP
2=X となる場合は,2 個の白玉と 1 個の黒玉を取り出す場合である。2 個の白玉の取り
出し方は 1 通り,1 個の黒玉を取り出す方法は 3 通りであるから,
103
1031)2( =
×==XP
また,
1)2()1()0( ==+=+= XPXPXP
であるから,
106
103
1011)1( =
+−==XP
従って, X の確率分布は,右の表のようになる。 3. 離散的確率変数 X の確率の意味
離散的確率変数の確率の意味
離散的確率変数 X においては,確率 )( aXP = は,次の意味になる。
① 標本空間Ωにおいて, aX = となる標本点の個数の割合 ( aX = となる標本点の個数の全標本点の個数に対する割合)
② 実現値 a の相対度数 (実現値 a の度数の総度数に対する割合)
従って, X の確率分布表は,次の意味になる。
異なる実現値ごとの標本点の個数の割合を示した表 X の実現値の相対度数分布表
例1(復習)
次の 6 個の数値がある。
1, 1, 2, 2, 2, 3
この 6 個の数値において,1 の度数は 2,2 の度数は 3,3 の度数は 1 である。度数とは,そ
の数値の個数のことである。総度数,すなわち,度数の合計は 6 である。 1 の相対度数とは,1 の度数の総度数に対する割合である。つまり,1 の個数の全個数 6 に対
する割合である。従って,
1 の相対度数621
==総度数
の度数
1 2 3 計
101
106
103 1
X
P
統計学 補足文書
6
他も同様であるから,各数値とその相対度数を示した,次の相対度数分布表が得られる。相
対度数の合計は,必ず 1 になる。
数値 1 2 3 計 相対度数 2/6 3/6 1/6 1
これは,6 個の数値において,異なる数値 1,2,3 とそれらの割合を表した表である。 例2
X を,試行T に対する確率変数とする。 X は確率変数であるから,試行T を行うと,その
結果に対して X の値が定まる。これは,各標本点に対して X の値が定まることと同じ意味で
ある。この X の値を「 X の実現値」と言った。 いま,標本点と実現値との対応関係は,次のようになっているとしよう。
標本点 1ω 2ω 3ω 4ω 5ω 6ω ↓ ↓ ↓ ↓ ↓ ↓
X の実現値 1 1 2 2 2 3
これを,さらに詳しく書くと,次のとおり。
ここで, 1=X となる標本点は, 21 , ωω である。よって,確率 )1( =XP は,事象
, 21 ωω=A の確率であり,
)1( =XP =( 1=X となる標本点の個数の全標本点の個数に対する割合) =( X のすべての実現値における 1 の相対度数) = 2/6
他の確率も同様であり, X の確率分布表は,次のようになる。
1 2 3 計 2/6 3/6 1/6 1
この表は,次の 2 通りの視点で読むことができる。
標本空間での実現値ごとの標本点の個数の割合 1=X となる標本点の個数の割合は 2/6,他も同様
XP
標本空間Ω のすべての実現値
2 個の標本点 1ω , 2ω 1,1 1 が 2 個
3 個の標本点 3ω , 4ω , 5ω 2,2,2 2 が 3 個
1 個の標本点 6ω 3 3 が 1 個
6 個の標本点 6 個の数値
X
統計学 補足文書
7
X のすべての実現値の相対度数分布表
上記の確率分布表は,例 1 の相対度数分布表と全く同じである。つまり,離散的確率変数 Xの確率分布表とは, X のすべての実現値の相対度数分布表のことである。 4. 確率変数の平均・分散・標準偏差
確率変数の平均・分散・標準偏差
(1) 定義
確率変数 の確率分布が右の表のとおりである とき, の平均,分散,標準偏差を次のように 定義する。
① X の平均 μXE =)(
∑=+++=i
iinn pxpxpxpxXE 2211)(
② X の分散 2)( σXV =
nn pxpxpxXV 22
221
21 )()()()( µµµ −++−+−=
∑ −=i
ii px 2)( µ
③ X の標準偏差 σXσ =)(
)()( XVX =σ
(2) 上記は,次の意味でもある。
① X の平均 )( XE … のすべての実現値の平均 ② X の分散 )( XV … のすべての実現値の分散 ③ X の標準偏差 )( Xσ … のすべての実現値の標準偏差
すなわち, X のすべての実現値の平均を x ,分散を2
xσ ,標準偏差を xσ とすると,
xXE =)( ,2)( xXV σ= , xX σσ =)(
離散的確率変数 X の平均・分散・標準偏差の定義は上記のとおりだが,これは, X のすべ
ての実現値の平均・分散・標準偏差のことである。これを簡単な例で確認してみよう。 試行の標本点の個数は,全部で 6 個とする。このとき,確率変数 X の実現値も 6 個である。
この 6 個の実現値は,
1, 1, 2, 2, 2, 3
であるとする。 このとき, X の確率分布は右の表のとおり。
XX
XXX
… 計 … 1
X 1x 2x nx
P 1p 2p np
1 2 3 計 2/6 3/6 1/6 1
XP
統計学 補足文書
8
6 個の実現値の平均を x ,分散を2
xσ ,標準偏差を xσ とすると,
)133221(61
×+×+×=x613
632
621 ×+×+×=
)( XE=
また, )( XE=µ とおくと, µ=x であるから,
1)3(3)2(2)1(61 2222 ×−+×−+×−= µµµσ x
61)1(
63)1(
62)1( 222 ×−+×−+×−= µµµ
)( XV=
よって, xxXVX σσσ === 2)()( である。 例
確率変数 X の確率分布が右のとおりであるとき, X の平均 )( XE ,分散 )( XV ,標準偏差 )( Xσ を 求めよ。 <解> X の平均は
125.025.0125.00)( =×+×+×=XE
X の分散は
5.025.0)12(5.0)11(25.0)10()( 222 =×−+×−+×−=XV
X の標準偏差は
71.05.0)()( ≒== XVXσ
(注意) この例から, X の実現値の平均や分散は,その割合から計算できることを理解しよう。 X のすべての実現値は
0,……,0, 1,……,1, 2,……,2 (0,1,2 の個数は不明)
の状態である。実現値が全部で何個あるのかも不明である。 しかし,確率分布表から,0 は 25%,1 は 50%,2 は 25%あることがわかる。
0 1 2 計 割合 25% 50% 25% 1
このとき,実現値の平均は,実現値と割合を掛けて合計すれば求められる。すなわち,
125.025.0125.00)( =×+×+×=XE
X
0 1 2 計 0.25 0.5 0.25 1
XP
統計学 補足文書
9
が実現値の平均になる。 実現値と割合(確率)から,実現値の平均や分散が計算できる。これが,確率変数を導入す
る 1 つの理由である。 5. 確率変数からつくられる式
確率変数変数から作られる式
確率変数 X の値によって値が定まる X の式は,みな確率変数になり,確率分布表におけ
る確率は変わらない。例えば,
X2 , X21
, 53 +X , 2X , 12 ++ XX
は,みな確率変数であり,確率も変わらない。
例えば,X の値によって 53 +X の値も決まる。よって,試行の結果に対して 53 +X の値が定まるので, 53 +X は確率変数になる。さらに,確率分布表における確率も変わらない。 例えば, X の確率分布は,次のとおりとする。
1 2 3 計 2/6 3/6 1/6 1
いま, X の実現値の個数(標本点の個数)が全部で 6 個とすれば, X のすべての実現値は
1,1, 2 , 2 , 2 , 3
である。 このとき, 53 +X の実現値は,当然
513 +× , 513 +× , 523 +× , 523 +× , 523 +× , 533 +×
の 6 個となる。そして,最初の 2 つの実現値 1 から 2 つの実現値 513 +× が登場するので,
513 +× の割合も 2/6
よって, 53 +X の確率分布は次のようになり,実現値の確率(割合)も変わらない。
3×1+5 3×2+5 3×3+5 計 2/6 3/6 1/6 1
確率変数 2X を考えても, 2X の実現値は 21 , 21 , 22 , 22 , 22 , 23
となるので, 2X の確率分布は次のようになり,確率は変わらない。
21 22 23 計 2/6 3/6 1/6 1
XP
XP
XP
統計学 補足文書
10
6. 確率変数の 1 次変換
確率変数の 1次変換(公式)
X を確率変数, ba , を定数とするとき,次が成り立つ。
(1) bXEabXaE +=+ )()(
(2) )()( 2 XVabXaV =+
(3) )(||)( XabXa σσ =+
上記は自明だが,定義に従って証明してみる。 確率変数 X から,
bXaY += ( ba , は定数)
によって,確率変数Y をつくることを, X の 1 次変換という。(データの場合と同様) いま, X の確率分布は,次のとおりとする。
… 計 … 1
このとき,Y の確率分布は,次のようになる。
Y bxa +1 bxa +2 … bxa n + 計
… 1
従って,確率変数の平均の定義から,
∑ ∑ ∑ +=+=+=i i i
iiiii bXEapbpxapbxaYE )()()(
ここで,確率の合計は 1,すなわち,∑ =i
ip 1 に注意しよう。
また, µ=)( XE とおくと, baYE += µ)( であるから,
)()()()()( µµ −=+−+=−+ iii xababxaYEbxa
従って, ∑∑ −=−+=
iii
iii pxapYEbxaYV 222 )()()()( µ
∑ =−=i
ii XVapxa )()( 222 µ
よって,
)(||)(||)()()( 2 XaXVaXVaYVY σσ ====
確率変数の 1 次変換は,その実現値を 1 次変換しているにすぎないので,上記はすでに証明
X 1x 2x nx
P 1p 2p np
P 1p 2p np
統計学 補足文書
11
している。すなわち, X のすべての実現値を ix で表せば, bxaY += のすべての実現値は bxa i + で表現される。ここで,
bxay ii +=
とおけば,データの場合の 1 次変換の公式より,
bXEabxayYE +=+== )()(
)()( 2222 XVaaYV xy === σσ 例
確率変数 X について, X の平均を µ , X の標準偏差をσ とするとき,(1)~(4)を µ とσ で
表せ。 (1) )62( −XE (2) )62( −XV (3) )62( +− XE (4) )62( +− XV
<解> 仮定より, µ=)( XE である。また, X の標準偏差がσ であるから, X の分散は 2σ であ
る。すなわち,2)( σ=XV である。
公式を忠実に使うと,
(1) 62)6()(2))6(2()62( −=−+=−+=− µXEXEXE
(2) 22 4)(2)62( σ==− XVXV
(3) 6)(26)()2()6)2(()62( +−=+−=+−=+− XEXEXEXE
(4) 22 4)()2()62( σ=−=+− XVXV 7. 確率変数の分散の公式
確率変数の分散の公式
確率変数 X の分散 )( XV について,次の等式が成り立つ。 22 )()()( XEXEXV −=
定義に従って証明してみる。 いま, X の確率分布は,次のとおりとする。
… 計 … 1
このとき, 2X の確率分布は,次のようになる。
2X 2
1x 22x … 2
nx 計
… 1
X 1x 2x nx
P 1p 2p np
P 1p 2p np
統計学 補足文書
12
従って, µ=)( XE とおくと,確率変数の分散の定義から,
∑ ∑ +−=−=i i
iiiii pxxpxYV )2()()( 222 µµµ
∑∑ ∑ ∑ ⋅+⋅−=+−=i
iii i i
iiiii pxppxpx 122 2222 µµµµµ
2222 )()()( XEXEXE −=−= µ (証明終)
上記の公式も,データの分散の公式と同じであるので,すでに証明している。すなわち, Xのすべての実現値を ix とし,すべての実現値の個数を m 個とすれば,
∑ −=−==i
ix XEXExxm
XV 22222 )()(1)( σ
例
確率変数 X の確率分布が,次のようになって いるとき, X の分散 2σ と標準偏差σ を求めよ。
<解> X の平均は,
21.053.036.01)( =×+×+×=XE
ここで, 2X の確率分布は,次のとおり。 2X 21 23 25 計
P 0.6 0.3 0.1 1
よって, X の分散は,公式より
22 )()()( XEXEXV −= 8.121.053.036.01 2222 =−×+×+×=
従って, X の標準偏差は
8.1)()( == XVXσ ≒ 34.1
計算に慣れたら, 2X の確率分布表は書かなくてもよい。データの分散は,
(データの 2 乗の平均)-(データの平均の 2 乗)
を覚えておけば, )( XV の計算式はすぐに書ける。
X 1 3 5 計 P 0.6 0.3 0.1 1
統計学 補足文書
13
8. 確率変数の標準化
確率変数の標準化 確率変数 X の平均が µ ,標準偏差がσ であるとき,
σµ
σ−
=−
=X
XXEXZ)(
)(
とおくと,確率変数 Z について次が成り立つ。
平均 0)( =ZE , 標準偏差 1)( =Zσ
データの場合と全く同様である。上記の確率変数 Z を,X の標準測度(標準化変量)という。
また, X から Z をつくることを, X を標準化するという。 標準化は,特別な 1 次変換であり,どのような確率変数も標準化してしまえば,平均は 0,標準偏差は 1 になる。 上記は,確率変数の 1 次変換の公式を使えば,次のようにすぐに証明できる。 µ=)( XE ,
2)( σ=XV であり,
−+⋅=
σµ
σXZ 1
⇐ bXa + の形
の形であるので,1 次変換の公式より
01)(1)( =
−+⋅=
−+=
σµµ
σσµ
σXEZE
11)(1)( 222
=⋅
=
= σ
σσXVZV
11)()( === ZVZσ
9. 偏差値
n 個の点数に対して,各点数の偏差値を考えることができた。そして, n 個の偏差値の平均
は常に 50,標準偏差は常に 10 であった。同様に,確率変数 X の値が試験の点数のとき,X の
偏差値を考えることができる。
偏差値 確率変数 X の平均を µ,標準偏差をσ とする。 X の値が試験の点数のとき,
5010 +×−
=σ
µXT
を, X の偏差値と呼ぶ。T は確率変数になり,次が常に成り立つ。
統計学 補足文書
14
平均 50)( =TE , 標準偏差 10)( =Tσ
証明は次のとおり。σµ−
=XZ とおくと,
505001050)(10)5010()( =+×=+=+= ZEZETE
10110)(10)( =×== ZT σσ
10. 母集団と標本
(1) 調査や観測の対象となる集団を「母集団」といい,母集団を構成する 1 つ 1 つのものを「個
体」という。個体の個数が無限の場合を「無限母集団」,有限の場合を「有限母集団」とい
う。
(2) 個体は,個体特有の性質(特性)をいろいろ持っているが,それらは数値で表現されるこ
とが多い。個体の特性を表す数値を,「個体の特性値」という。
(3) 統計学の大きな目的は,個体の特性値に関する母集団の特徴を調べることである。その特
徴を調べるために個体を調査することを,「統計調査」という。統計調査には,「全数調査」
と「標本調査」がある。
(4) 全数調査とは,母集団のすべての個体を調査することである。例えば,ある都市の高校生
の身長の特徴を調べるために,その都市の高校生全員の身長を調査するのは全数調査である。
また,日本の人口を調べるために,5 年に 1 度行われる国勢調査も全数調査である。
(5) 一方,母集団の特徴を調べるために,母集団から一部分の個体を取り出して,取り出した
個体のみを調査することを「標本調査」という。取り出した個体の集まりを「標本(サンプ
ル)」,また,標本を取り出すことを「標本抽出」または単に「抽出」という。
(6) 一般に,全数調査は大変な労力や時間・費用を要し,現実的には不可能な場合が多い。例
えば,テレビ番組の視聴率調査のために日本の全世帯を調査するのは不可能に近く,仮に全
世帯を調査してもそれほど意味のある結果は得られない。また,ビール工場での製品の品質
調査において,全数調査を実施すれば,製品のすべてが無駄になってしまう。
(7) 現在では標本調査が主流であり,実際に調査・観測した標本から母集団の特徴を推測して
いく。これを,統計的推測という。そして,統計的推測を扱う分野が推測統計学である。
統計学 補足文書
15
11. 母集団への確率変数の導入
母集団への確率変数の導入
(1) 母集団の個体の特性値 X は,次の試行により,確率変数になる。
試行T :母集団から無作為に(ランダム)に 1 個の個体を抽出する
実現値:抽出した個体の特性値を X の実現値とする
(2) 試行T の結果(標本点)は,抽出した個体である。標本点の集合が標本空間であるか
ら,試行T の標本空間Ωは母集団そのものになり,母集団の個体が標本点になる。
※ ただし,すべての個体の特性値の集まりを標本空間と考えることもある。
(3) X の確率分布を母集団分布という。
(4) すべての個体の特性値の平均を「母平均」,分散を「母分散」,標準偏差を「母標準偏
差」という。次が成り立つ。
== )( XEµ 母平均 == )(2 XVσ 母分散
== )( Xσσ 母標準偏差
標本調査では,個体の特性値を表す変量 X を,確率変数と見なしていく。そのために,母集
団から無作為(ランダム)に 1 個の個体を抽出する,という試行を考える。そして,抽出した
個体の特性値を X の実現値と考える。 この試行の 1 つの結果(1 つの標本点)は,母集団から抽出した 1 個の個体であり,試行の
標本空間はすべての標本点の集合,すなわち母集団自身になる。よって,母集団の個体が標本
点であり,標本点からその特性値という値が定まる が確率変数になる。この X の確率分布
を「母集団分布」という。 標本調査の大きな目的は,特性値の割合や,その母平均や母標準偏差を知ることである。す
なわち,X の確率分布(母集団分布)や,X の平均・標準偏差を求めることである。従って,
観測した標本から母集団分布をどのように決定するかが大きな課題になる。 なお,個体を抽出する際には,どの個体も平等に選ばれる必要がある。そうでないと,抽出
した個体は,母集団における特定の偏った個体になり,母集団分布を決定することができない。 無作為に 1 個選ぶとは,作為が無く選ぶこと,偶然の結果として個体を選ぶという意味であ
り,母集団の大きさ(母集団に含まれる個体の個数)が であれば,どの個体も 1/ の等確
率で選ぶことである。実際の抽出では,無作為に選ぶために乱数表など使用する。 なお,特性値 を決めれば,考察の対象は個体そのものではなく,個体の特性値である。そ
の意味で,すべての個体の特性値の集まりを標本空間と考える場合も多い。
X
n n
X
統計学 補足文書
16
例1
10 人の人からなる集団を母集団とし,年齢という特性値を で表して, を確率変数と考
える。この母集団において,20 歳の人が 3 人,30 歳の人が 4 人,40 歳の人が 3 人いたとする。
母集団から無作為に 1 人を選んだとき,その人が 20 歳である確率は明らかに 3/10 である
が,この値は,20 歳の人の人数の割合である。特性値の集まりで考えれば,20 の相対度数で
ある。 よって, が 20 の値をとる確率 は,
20 歳の人の人数の割合 20 の相対度数
の確率分布(母集団分布)は次のようになるが,これは年齢の相対度数分布表である。
20 30 40 計 3/10 4/10 3/10 1
例2
人からなる母集団があり,10 歳の人が 60%,30 歳の人が 30%,50 歳の人が 10%いるとす
る。このとき,年齢を X とし,母集団分布,および,確率変数 X の平均,分散,標準偏差を
求めよ。 <解> X の確率分布表は,次のようになる。これが母集団分布である。
X 10 30 50 計 P 0.6 0.3 0.1 1
X の平均(母平均)は
201.0503.0306.010)( =×+×+×=XE
X の分散(母分散)は,分散の定義式と公式のどちらでも計算できる。一般には,公式を使っ
た方が楽である。
(定義式) 1801.0)2050(3.0)2030(6.0)2010()( 222 =×−+×−+×−=XV
(公式) 180201.0503.0306.010)( 2222 =−×+×+×=XV
X の標準偏差(母標準偏差)は
42.13180)()( ≒== XVXσ
X X
X )20( =XP
== )20( XP =
X
XP
母集団 = 標本空間 特性値の集まり
20 歳 3 人 20,20,20 30 歳 4 人 30,30,30,30 40 歳 3 人 40,40,40
年齢