27
統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群

11. 標本平均と母平均 (1) - GitHub Pages...統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群 今日の目標

  • Upload
    others

  • View
    8

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 11. 標本平均と母平均 (1) - GitHub Pages...統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群 今日の目標

統計学 2

11. 標本平均と母平均 (1)

矢内 勇生

2019年5月23日

高知工科大学 経済・マネジメント学群

Page 2: 11. 標本平均と母平均 (1) - GitHub Pages...統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群 今日の目標

今日の目標

• 大数の法則を理解する たいすう

• 標本分布と標準誤差を理解する

!2

Page 3: 11. 標本平均と母平均 (1) - GitHub Pages...統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群 今日の目標

大数の法則 (Law of Large Numbers: LLN)• ある試行(例:コイン投げ)においてある事象が起こる(例:表が出る)確率がπ(例:0.5)だとする(さらに、各試行は他の試行に影響を及ぼさない[各試行は独立である]とする)

• 大数の法則:試行回数を増やすにつれて、ある事象が起こる割合(比率)はπに近づく

★ 厳密には、「大数の弱法則(Weak Law of Large Numbers)」と「大数の強法則(Strong Law of Large Numbers)」を区別する必要がある

!3

Page 4: 11. 標本平均と母平均 (1) - GitHub Pages...統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群 今日の目標

LLNの例1:コイン投げ(1)

• 正しいコインを投げたとき、表が出る確率 π = 0.5

‣ 実際にコインをn 回投げたとき、表が出る割合 p は0.5になる?

!4

Page 5: 11. 標本平均と母平均 (1) - GitHub Pages...統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群 今日の目標

LLNの例1:コイン投げ(2)表が出る割合 p は0.5になるとは限らない!

• 実際にコインを投げてみると

- 1回目に表が出た → p = 1/1 = 1

- 2回目も表が出た → p = 2/2 = 1

- 3回目も表が出た → p = 3/3 = 1

- 4回目は裏が出た → p = 3/4 = 0.75!5

Page 6: 11. 標本平均と母平均 (1) - GitHub Pages...統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群 今日の目標

LLNの例1:コイン投げ(3)

• コインを投げる回数が少ないとき、表が出る割合p は0.5から離れた値になりやすい

‣ LLN:投げる回数 n を大きくすれば、p が0.5に近づく!(シミュレーションで示す)

★コイン投げの回数 = 標本サイズ

!6

Page 7: 11. 標本平均と母平均 (1) - GitHub Pages...統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群 今日の目標

標本分布 (sampling distribution)• 母集団からサイズ n の標本を単純無作為抽出するとき、選ばれる個体の組み合わせは何通りもある

• 抽出可能な組み合わせをすべて考え、それぞれの標本で統計量(例:女性の割合)を求めると、その統計量は分布する

‣ こうして求められる分布(統計量の標本ごとの分布)を標本分布と呼ぶ

!7

Page 8: 11. 標本平均と母平均 (1) - GitHub Pages...統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群 今日の目標

標本分布の例(1)

!8

個人 A B C D E

身長(cm) 158 159 160 161 162

5人の母集団からサイズ2の標本を選ぶ: 全部で5C2=10 通りの選び方

標本 {A, B} {A, C} {A, D} {A, E} {B, C} {B, D} {B, E} {C, D} {C, E} {D, E}

標本平均 158.5 159 159.5 160 159.5 160 160.5 160.5 161 161.5

Page 9: 11. 標本平均と母平均 (1) - GitHub Pages...統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群 今日の目標

標本分布の例(2-1)• 男5400人、女4600人の計1万人から100人選ぶ

• 1万人から100人を選ぶ方法は全部で約6.5x10241通り → 全部の組み合わせ:標本分布

➡数が多いので全部の組み合わせを考えるのは困難

➡コンピュータ・シミュレーションでn=100のサンプルを100万個抽出し、擬似的な標本分布を得る

!9

Page 10: 11. 標本平均と母平均 (1) - GitHub Pages...統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群 今日の目標

標本分布の例(2-2)

!10

n=100

母比率 π=0.46

女性の標本比率

確率密度

0.0 0.2 0.4 0.6 0.8

0.0

1.0

2.0

3.0

0.46

Page 11: 11. 標本平均と母平均 (1) - GitHub Pages...統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群 今日の目標

標本分布と標本サイズ• 標本サイズnを変えれば、得られる標本分布も変わる

- 10人の母集団から2人を選ぶ:45通り

- 10人の母集団から3人を選ぶ:120通り

- 10人の母集団から9人を選ぶ:10通り

➡ 可能な組み合わせが異なれば、統計量の分布も変化する

!11

Page 12: 11. 標本平均と母平均 (1) - GitHub Pages...統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群 今日の目標

標準誤差 (standard error: SE)

• 標準誤差 = 標本分布に現れるばらつき

= 統計量の標準偏差

• 母集団が十分大きい(目安:母集団が標本サイズnの100倍以上)とき、標準誤差 SE は

!12

またはSE =

母標準偏差p標本サイズ

=�pn

<latexit sha1_base64="2Fy6RaRwGsD8xczJNjXEFN5cKaU=">AAACkXicdVFNThsxFH4zLTRN+QnNCrGxiFqxQJEHIRUWVFFRJaQuGgQBpMwIeRxPMPHYg+2pGo3mGpygV+imd+iGXS/BGepMZwGEPulJn76fZ/s5zgQ3FuM/nv/i5cLiq8br5pul5ZXV1trbM6NyTdmAKqH0RUwME1yygeVWsItMM5LGgp3Hk8OZfv6NacOVPLXTjEUpGUuecEqso1TrFEJIIQYF36GAE/gMJTThPSA4cB1CAhoIUKc98E1+X6/L2/7X6N65y0ozcOOc9rHven28jX/iH/hX5SudFv53ugEOY5clcxPlLHvZ6uAurgrNg6AGHairf9m6C0eK5imTlgpizDDAmY0Koi2ngpXNMDcsI3RCxmzooCQpM1FRbbRE7xwzQonSrqVFFfswUZDUmGkaO2dK7JV5qs3I57RhbpO9qOAyyy2T9N9BSS6QVWj2PWjENaNWTB0gVHN3V0SviCbUuk9suiUET588D852ugHuBse7nd6neh0N2IBN2IIAPkAPjqAPA6DeirfrHXgf/ba/7/f82ut7daYNj8r/8heCha8R</latexit><latexit sha1_base64="2Fy6RaRwGsD8xczJNjXEFN5cKaU=">AAACkXicdVFNThsxFH4zLTRN+QnNCrGxiFqxQJEHIRUWVFFRJaQuGgQBpMwIeRxPMPHYg+2pGo3mGpygV+imd+iGXS/BGepMZwGEPulJn76fZ/s5zgQ3FuM/nv/i5cLiq8br5pul5ZXV1trbM6NyTdmAKqH0RUwME1yygeVWsItMM5LGgp3Hk8OZfv6NacOVPLXTjEUpGUuecEqso1TrFEJIIQYF36GAE/gMJTThPSA4cB1CAhoIUKc98E1+X6/L2/7X6N65y0ozcOOc9rHven28jX/iH/hX5SudFv53ugEOY5clcxPlLHvZ6uAurgrNg6AGHairf9m6C0eK5imTlgpizDDAmY0Koi2ngpXNMDcsI3RCxmzooCQpM1FRbbRE7xwzQonSrqVFFfswUZDUmGkaO2dK7JV5qs3I57RhbpO9qOAyyy2T9N9BSS6QVWj2PWjENaNWTB0gVHN3V0SviCbUuk9suiUET588D852ugHuBse7nd6neh0N2IBN2IIAPkAPjqAPA6DeirfrHXgf/ba/7/f82ut7daYNj8r/8heCha8R</latexit><latexit sha1_base64="2Fy6RaRwGsD8xczJNjXEFN5cKaU=">AAACkXicdVFNThsxFH4zLTRN+QnNCrGxiFqxQJEHIRUWVFFRJaQuGgQBpMwIeRxPMPHYg+2pGo3mGpygV+imd+iGXS/BGepMZwGEPulJn76fZ/s5zgQ3FuM/nv/i5cLiq8br5pul5ZXV1trbM6NyTdmAKqH0RUwME1yygeVWsItMM5LGgp3Hk8OZfv6NacOVPLXTjEUpGUuecEqso1TrFEJIIQYF36GAE/gMJTThPSA4cB1CAhoIUKc98E1+X6/L2/7X6N65y0ozcOOc9rHven28jX/iH/hX5SudFv53ugEOY5clcxPlLHvZ6uAurgrNg6AGHairf9m6C0eK5imTlgpizDDAmY0Koi2ngpXNMDcsI3RCxmzooCQpM1FRbbRE7xwzQonSrqVFFfswUZDUmGkaO2dK7JV5qs3I57RhbpO9qOAyyy2T9N9BSS6QVWj2PWjENaNWTB0gVHN3V0SviCbUuk9suiUET588D852ugHuBse7nd6neh0N2IBN2IIAPkAPjqAPA6DeirfrHXgf/ba/7/f82ut7daYNj8r/8heCha8R</latexit><latexit sha1_base64="2Fy6RaRwGsD8xczJNjXEFN5cKaU=">AAACkXicdVFNThsxFH4zLTRN+QnNCrGxiFqxQJEHIRUWVFFRJaQuGgQBpMwIeRxPMPHYg+2pGo3mGpygV+imd+iGXS/BGepMZwGEPulJn76fZ/s5zgQ3FuM/nv/i5cLiq8br5pul5ZXV1trbM6NyTdmAKqH0RUwME1yygeVWsItMM5LGgp3Hk8OZfv6NacOVPLXTjEUpGUuecEqso1TrFEJIIQYF36GAE/gMJTThPSA4cB1CAhoIUKc98E1+X6/L2/7X6N65y0ozcOOc9rHven28jX/iH/hX5SudFv53ugEOY5clcxPlLHvZ6uAurgrNg6AGHairf9m6C0eK5imTlgpizDDAmY0Koi2ngpXNMDcsI3RCxmzooCQpM1FRbbRE7xwzQonSrqVFFfswUZDUmGkaO2dK7JV5qs3I57RhbpO9qOAyyy2T9N9BSS6QVWj2PWjENaNWTB0gVHN3V0SviCbUuk9suiUET588D852ugHuBse7nd6neh0N2IBN2IIAPkAPjqAPA6DeirfrHXgf/ba/7/f82ut7daYNj8r/8heCha8R</latexit>

SE =母標準偏差の推定値p

標本サイズ=

spn

<latexit sha1_base64="Bc8roYy+6a6qzjoLwNOs0sgdYxE=">AAACj3icdVFNThsxFH4zLZSm/IR2hbqxSEEsUORBlUCCoqgIqV2RigaQMiPkcTzBxGMPtqciGs01umDNgguw6R266a6X4Aw4QxZA2ic96dP342c/x5ngxmL81/NfvJyafjXzuvZmdm5+ob749sioXFPWoUoofRITwwSXrGO5Fewk04yksWDH8WBvpB//YNpwJb/bYcailPQlTzgl1lGqfgghpBCDgkso4BD2oYQarAKCT65DSEADAeq0R77B7/Ml+bN9EN1hSW+6V+0PLlVWHgMXLmGf+s+X+uv4Fl/jX5WvdFr4nylm4hw5SpzWG7iJq0KTIBiDBoyrfVr/E/YUzVMmLRXEmG6AMxsVRFtOBStrYW5YRuiA9FnXQUlSZqKi2meJVhzTQ4nSrqVFFfs4UZDUmGEaO2dK7Jl5ro3If2nd3CZbUcFlllsm6cOgJBfIKjT6HNTjmlErhg4Qqrm7K6JnRBNq3RfW3BKC50+eBEcbzQA3g28fG63P43XMwHtYhjUIYBNa8AXa0AHqzXob3ra34y/6m/6u33qw+t448w6elP/1HiKrsBY=</latexit><latexit sha1_base64="Bc8roYy+6a6qzjoLwNOs0sgdYxE=">AAACj3icdVFNThsxFH4zLZSm/IR2hbqxSEEsUORBlUCCoqgIqV2RigaQMiPkcTzBxGMPtqciGs01umDNgguw6R266a6X4Aw4QxZA2ic96dP342c/x5ngxmL81/NfvJyafjXzuvZmdm5+ob749sioXFPWoUoofRITwwSXrGO5Fewk04yksWDH8WBvpB//YNpwJb/bYcailPQlTzgl1lGqfgghpBCDgkso4BD2oYQarAKCT65DSEADAeq0R77B7/Ml+bN9EN1hSW+6V+0PLlVWHgMXLmGf+s+X+uv4Fl/jX5WvdFr4nylm4hw5SpzWG7iJq0KTIBiDBoyrfVr/E/YUzVMmLRXEmG6AMxsVRFtOBStrYW5YRuiA9FnXQUlSZqKi2meJVhzTQ4nSrqVFFfs4UZDUmGEaO2dK7Jl5ro3If2nd3CZbUcFlllsm6cOgJBfIKjT6HNTjmlErhg4Qqrm7K6JnRBNq3RfW3BKC50+eBEcbzQA3g28fG63P43XMwHtYhjUIYBNa8AXa0AHqzXob3ra34y/6m/6u33qw+t448w6elP/1HiKrsBY=</latexit><latexit sha1_base64="Bc8roYy+6a6qzjoLwNOs0sgdYxE=">AAACj3icdVFNThsxFH4zLZSm/IR2hbqxSEEsUORBlUCCoqgIqV2RigaQMiPkcTzBxGMPtqciGs01umDNgguw6R266a6X4Aw4QxZA2ic96dP342c/x5ngxmL81/NfvJyafjXzuvZmdm5+ob749sioXFPWoUoofRITwwSXrGO5Fewk04yksWDH8WBvpB//YNpwJb/bYcailPQlTzgl1lGqfgghpBCDgkso4BD2oYQarAKCT65DSEADAeq0R77B7/Ml+bN9EN1hSW+6V+0PLlVWHgMXLmGf+s+X+uv4Fl/jX5WvdFr4nylm4hw5SpzWG7iJq0KTIBiDBoyrfVr/E/YUzVMmLRXEmG6AMxsVRFtOBStrYW5YRuiA9FnXQUlSZqKi2meJVhzTQ4nSrqVFFfs4UZDUmGEaO2dK7Jl5ro3If2nd3CZbUcFlllsm6cOgJBfIKjT6HNTjmlErhg4Qqrm7K6JnRBNq3RfW3BKC50+eBEcbzQA3g28fG63P43XMwHtYhjUIYBNa8AXa0AHqzXob3ra34y/6m/6u33qw+t448w6elP/1HiKrsBY=</latexit><latexit sha1_base64="Bc8roYy+6a6qzjoLwNOs0sgdYxE=">AAACj3icdVFNThsxFH4zLZSm/IR2hbqxSEEsUORBlUCCoqgIqV2RigaQMiPkcTzBxGMPtqciGs01umDNgguw6R266a6X4Aw4QxZA2ic96dP342c/x5ngxmL81/NfvJyafjXzuvZmdm5+ob749sioXFPWoUoofRITwwSXrGO5Fewk04yksWDH8WBvpB//YNpwJb/bYcailPQlTzgl1lGqfgghpBCDgkso4BD2oYQarAKCT65DSEADAeq0R77B7/Ml+bN9EN1hSW+6V+0PLlVWHgMXLmGf+s+X+uv4Fl/jX5WvdFr4nylm4hw5SpzWG7iJq0KTIBiDBoyrfVr/E/YUzVMmLRXEmG6AMxsVRFtOBStrYW5YRuiA9FnXQUlSZqKi2meJVhzTQ4nSrqVFFfs4UZDUmGEaO2dK7Jl5ro3If2nd3CZbUcFlllsm6cOgJBfIKjT6HNTjmlErhg4Qqrm7K6JnRBNq3RfW3BKC50+eBEcbzQA3g28fG63P43XMwHtYhjUIYBNa8AXa0AHqzXob3ra34y/6m/6u33qw+t448w6elP/1HiKrsBY=</latexit>

Page 13: 11. 標本平均と母平均 (1) - GitHub Pages...統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群 今日の目標

標準誤差の特徴

• 標準誤差の大きさは、標本サイズn の平方根に反比例する

- nを4倍にすれば、SE は半分になる!

➡ nが大きいほど、統計的推測が正確になる

!13

Page 14: 11. 標本平均と母平均 (1) - GitHub Pages...統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群 今日の目標

標準誤差の例(1)

• 女性比率が0.46 の100万人の母集団から n人の標本を抽出し、女性比率を求めるときの標準誤差

- n=25のとき:

- n=100のとき:

- n=400のとき:

!14

��n

=

�0.46(1 � 0.46)�

400� 0.50

20= 0.025

�pn=

p0.46(1� 0.46)p

25⇡ 0.5

5= 0.1

<latexit sha1_base64="EFKzyFoPAd/o2+OrhfNXSAaAnV0=">AAACRHicbVDLSgMxFM3UV62vqks3wSLUhcNMabUboeDGZQX7gLaUTJppQzOZMcmIZZiPc+MHuPML3LhQxK2YaaegrRfCPZxzLvfmOAGjUlnWi5FZWV1b38hu5ra2d3b38vsHTemHApMG9pkv2g6ShFFOGooqRtqBIMhzGGk546tEb90TIanPb9UkID0PDTl1KUZKU/18p+sKhKOupEMPxbrfCRXxOM5dwrmSMJZZPi/aZ0k7jee2UkX7uigIhP+Qui2zEkcVPW2Zdq6fL1imNS24DOwUFEBa9X7+uTvwcegRrjBDUnZsK1C9CAlFMSN6VyhJgPAYDUlHQ448InvRNIQYnmhmAF1f6McVnLK/JyLkSTnxHO30kBrJRS0h/9M6oXKrvYjyIFSE49kiN2RQ+TBJFA6oIFixiQYIC6pvhXiEdBpK556EYC9+eRk0S6atI7spF2rVNI4sOALHoAhscAFq4BrUQQNg8AhewTv4MJ6MN+PT+JpZM0Y6cwj+lPH9A9yWr/E=</latexit><latexit sha1_base64="EFKzyFoPAd/o2+OrhfNXSAaAnV0=">AAACRHicbVDLSgMxFM3UV62vqks3wSLUhcNMabUboeDGZQX7gLaUTJppQzOZMcmIZZiPc+MHuPML3LhQxK2YaaegrRfCPZxzLvfmOAGjUlnWi5FZWV1b38hu5ra2d3b38vsHTemHApMG9pkv2g6ShFFOGooqRtqBIMhzGGk546tEb90TIanPb9UkID0PDTl1KUZKU/18p+sKhKOupEMPxbrfCRXxOM5dwrmSMJZZPi/aZ0k7jee2UkX7uigIhP+Qui2zEkcVPW2Zdq6fL1imNS24DOwUFEBa9X7+uTvwcegRrjBDUnZsK1C9CAlFMSN6VyhJgPAYDUlHQ448InvRNIQYnmhmAF1f6McVnLK/JyLkSTnxHO30kBrJRS0h/9M6oXKrvYjyIFSE49kiN2RQ+TBJFA6oIFixiQYIC6pvhXiEdBpK556EYC9+eRk0S6atI7spF2rVNI4sOALHoAhscAFq4BrUQQNg8AhewTv4MJ6MN+PT+JpZM0Y6cwj+lPH9A9yWr/E=</latexit><latexit sha1_base64="EFKzyFoPAd/o2+OrhfNXSAaAnV0=">AAACRHicbVDLSgMxFM3UV62vqks3wSLUhcNMabUboeDGZQX7gLaUTJppQzOZMcmIZZiPc+MHuPML3LhQxK2YaaegrRfCPZxzLvfmOAGjUlnWi5FZWV1b38hu5ra2d3b38vsHTemHApMG9pkv2g6ShFFOGooqRtqBIMhzGGk546tEb90TIanPb9UkID0PDTl1KUZKU/18p+sKhKOupEMPxbrfCRXxOM5dwrmSMJZZPi/aZ0k7jee2UkX7uigIhP+Qui2zEkcVPW2Zdq6fL1imNS24DOwUFEBa9X7+uTvwcegRrjBDUnZsK1C9CAlFMSN6VyhJgPAYDUlHQ448InvRNIQYnmhmAF1f6McVnLK/JyLkSTnxHO30kBrJRS0h/9M6oXKrvYjyIFSE49kiN2RQ+TBJFA6oIFixiQYIC6pvhXiEdBpK556EYC9+eRk0S6atI7spF2rVNI4sOALHoAhscAFq4BrUQQNg8AhewTv4MJ6MN+PT+JpZM0Y6cwj+lPH9A9yWr/E=</latexit><latexit sha1_base64="EFKzyFoPAd/o2+OrhfNXSAaAnV0=">AAACRHicbVDLSgMxFM3UV62vqks3wSLUhcNMabUboeDGZQX7gLaUTJppQzOZMcmIZZiPc+MHuPML3LhQxK2YaaegrRfCPZxzLvfmOAGjUlnWi5FZWV1b38hu5ra2d3b38vsHTemHApMG9pkv2g6ShFFOGooqRtqBIMhzGGk546tEb90TIanPb9UkID0PDTl1KUZKU/18p+sKhKOupEMPxbrfCRXxOM5dwrmSMJZZPi/aZ0k7jee2UkX7uigIhP+Qui2zEkcVPW2Zdq6fL1imNS24DOwUFEBa9X7+uTvwcegRrjBDUnZsK1C9CAlFMSN6VyhJgPAYDUlHQ448InvRNIQYnmhmAF1f6McVnLK/JyLkSTnxHO30kBrJRS0h/9M6oXKrvYjyIFSE49kiN2RQ+TBJFA6oIFixiQYIC6pvhXiEdBpK556EYC9+eRk0S6atI7spF2rVNI4sOALHoAhscAFq4BrUQQNg8AhewTv4MJ6MN+PT+JpZM0Y6cwj+lPH9A9yWr/E=</latexit>

�pn=

p0.46(1� 0.46)p

100⇡ 0.5

10= 0.05

<latexit sha1_base64="/63m3dvB7UoKGZzVEjuMyprleBk=">AAACR3icbVDPS8MwGE3n7/mr6tFLcAjzYEll010EwYtHBaeDtY40S7dgmtYkFUfpf+fFqzf/BS8eFPFoOivo9IPwPd57H9+XFyScKY3Qk1WZmp6ZnZtfqC4uLa+s2mvrFypOJaFtEvNYdgKsKGeCtjXTnHYSSXEUcHoZXB8X+uUtlYrF4lyPEupHeCBYyAjWhurZV14oMck8xQYRzk2/kToTeV49hN9KwSCnsV93d4u2k3/bXISM0cNJIuO70o6cZm4EM48c1Kz27Jrp44J/gVuCGijrtGc/ev2YpBEVmnCsVNdFifYzLDUjnJptqaIJJtd4QLsGChxR5WfjHHK4bZg+DGNpntBwzP6cyHCk1CgKjDPCeqgmtYL8T+umOmz5GRNJqqkgX4vClEMdwyJU2GeSEs1HBmAimbkVkiE2eWgTfRGCO/nlv+Biz3GR4541aketMo55sAm2QB244AAcgRNwCtqAgHvwDF7Bm/VgvVjv1seXtWKVMxvgV1WsT3kGr5o=</latexit><latexit sha1_base64="/63m3dvB7UoKGZzVEjuMyprleBk=">AAACR3icbVDPS8MwGE3n7/mr6tFLcAjzYEll010EwYtHBaeDtY40S7dgmtYkFUfpf+fFqzf/BS8eFPFoOivo9IPwPd57H9+XFyScKY3Qk1WZmp6ZnZtfqC4uLa+s2mvrFypOJaFtEvNYdgKsKGeCtjXTnHYSSXEUcHoZXB8X+uUtlYrF4lyPEupHeCBYyAjWhurZV14oMck8xQYRzk2/kToTeV49hN9KwSCnsV93d4u2k3/bXISM0cNJIuO70o6cZm4EM48c1Kz27Jrp44J/gVuCGijrtGc/ev2YpBEVmnCsVNdFifYzLDUjnJptqaIJJtd4QLsGChxR5WfjHHK4bZg+DGNpntBwzP6cyHCk1CgKjDPCeqgmtYL8T+umOmz5GRNJqqkgX4vClEMdwyJU2GeSEs1HBmAimbkVkiE2eWgTfRGCO/nlv+Biz3GR4541aketMo55sAm2QB244AAcgRNwCtqAgHvwDF7Bm/VgvVjv1seXtWKVMxvgV1WsT3kGr5o=</latexit><latexit sha1_base64="/63m3dvB7UoKGZzVEjuMyprleBk=">AAACR3icbVDPS8MwGE3n7/mr6tFLcAjzYEll010EwYtHBaeDtY40S7dgmtYkFUfpf+fFqzf/BS8eFPFoOivo9IPwPd57H9+XFyScKY3Qk1WZmp6ZnZtfqC4uLa+s2mvrFypOJaFtEvNYdgKsKGeCtjXTnHYSSXEUcHoZXB8X+uUtlYrF4lyPEupHeCBYyAjWhurZV14oMck8xQYRzk2/kToTeV49hN9KwSCnsV93d4u2k3/bXISM0cNJIuO70o6cZm4EM48c1Kz27Jrp44J/gVuCGijrtGc/ev2YpBEVmnCsVNdFifYzLDUjnJptqaIJJtd4QLsGChxR5WfjHHK4bZg+DGNpntBwzP6cyHCk1CgKjDPCeqgmtYL8T+umOmz5GRNJqqkgX4vClEMdwyJU2GeSEs1HBmAimbkVkiE2eWgTfRGCO/nlv+Biz3GR4541aketMo55sAm2QB244AAcgRNwCtqAgHvwDF7Bm/VgvVjv1seXtWKVMxvgV1WsT3kGr5o=</latexit><latexit sha1_base64="/63m3dvB7UoKGZzVEjuMyprleBk=">AAACR3icbVDPS8MwGE3n7/mr6tFLcAjzYEll010EwYtHBaeDtY40S7dgmtYkFUfpf+fFqzf/BS8eFPFoOivo9IPwPd57H9+XFyScKY3Qk1WZmp6ZnZtfqC4uLa+s2mvrFypOJaFtEvNYdgKsKGeCtjXTnHYSSXEUcHoZXB8X+uUtlYrF4lyPEupHeCBYyAjWhurZV14oMck8xQYRzk2/kToTeV49hN9KwSCnsV93d4u2k3/bXISM0cNJIuO70o6cZm4EM48c1Kz27Jrp44J/gVuCGijrtGc/ev2YpBEVmnCsVNdFifYzLDUjnJptqaIJJtd4QLsGChxR5WfjHHK4bZg+DGNpntBwzP6cyHCk1CgKjDPCeqgmtYL8T+umOmz5GRNJqqkgX4vClEMdwyJU2GeSEs1HBmAimbkVkiE2eWgTfRGCO/nlv+Biz3GR4541aketMo55sAm2QB244AAcgRNwCtqAgHvwDF7Bm/VgvVjv1seXtWKVMxvgV1WsT3kGr5o=</latexit>

�pn=

p0.46(1� 0.46)p

400⇡ 0.5

20= 0.025

<latexit sha1_base64="Pob2G+bQd3UnquOBQ0Q5f2CKrX8=">AAACSHicbVDLSgMxFM3UV62vqks3wSLUhUOm1MdGKLhxWcE+oC0lk2baYCYzJhmxDPN5bly68xvcuFDEnZl2Ctp6IdzDOedyb44bcqY0Qq9Wbml5ZXUtv17Y2Nza3inu7jVVEElCGyTggWy7WFHOBG1opjlth5Ji3+W05d5dpXrrgUrFAnGrxyHt+XgomMcI1obqF/tdT2ISdxUb+jgx/V7qWCRJ4RLOlJRBdvWs7Jyk7TiZ2aoIGWMXh6EMHjM7sk+TuILMPLJR5bTQL5YMmBRcBE4GSiCrer/40h0EJPKp0IRjpToOCnUvxlIzwqlZFykaYnKHh7RjoMA+Vb14EkQCjwwzgF4gzRMaTtjfEzH2lRr7rnH6WI/UvJaS/2mdSHsXvZiJMNJUkOkiL+JQBzBNFQ6YpETzsQGYSGZuhWSETSDaZJ+G4Mx/eRE0K7aDbOemWqpdZHHkwQE4BGXggHNQA9egDhqAgCfwBj7Ap/VsvVtf1vfUmrOymX3wp3K5HxGOr9o=</latexit><latexit sha1_base64="Pob2G+bQd3UnquOBQ0Q5f2CKrX8=">AAACSHicbVDLSgMxFM3UV62vqks3wSLUhUOm1MdGKLhxWcE+oC0lk2baYCYzJhmxDPN5bly68xvcuFDEnZl2Ctp6IdzDOedyb44bcqY0Qq9Wbml5ZXUtv17Y2Nza3inu7jVVEElCGyTggWy7WFHOBG1opjlth5Ji3+W05d5dpXrrgUrFAnGrxyHt+XgomMcI1obqF/tdT2ISdxUb+jgx/V7qWCRJ4RLOlJRBdvWs7Jyk7TiZ2aoIGWMXh6EMHjM7sk+TuILMPLJR5bTQL5YMmBRcBE4GSiCrer/40h0EJPKp0IRjpToOCnUvxlIzwqlZFykaYnKHh7RjoMA+Vb14EkQCjwwzgF4gzRMaTtjfEzH2lRr7rnH6WI/UvJaS/2mdSHsXvZiJMNJUkOkiL+JQBzBNFQ6YpETzsQGYSGZuhWSETSDaZJ+G4Mx/eRE0K7aDbOemWqpdZHHkwQE4BGXggHNQA9egDhqAgCfwBj7Ap/VsvVtf1vfUmrOymX3wp3K5HxGOr9o=</latexit><latexit sha1_base64="Pob2G+bQd3UnquOBQ0Q5f2CKrX8=">AAACSHicbVDLSgMxFM3UV62vqks3wSLUhUOm1MdGKLhxWcE+oC0lk2baYCYzJhmxDPN5bly68xvcuFDEnZl2Ctp6IdzDOedyb44bcqY0Qq9Wbml5ZXUtv17Y2Nza3inu7jVVEElCGyTggWy7WFHOBG1opjlth5Ji3+W05d5dpXrrgUrFAnGrxyHt+XgomMcI1obqF/tdT2ISdxUb+jgx/V7qWCRJ4RLOlJRBdvWs7Jyk7TiZ2aoIGWMXh6EMHjM7sk+TuILMPLJR5bTQL5YMmBRcBE4GSiCrer/40h0EJPKp0IRjpToOCnUvxlIzwqlZFykaYnKHh7RjoMA+Vb14EkQCjwwzgF4gzRMaTtjfEzH2lRr7rnH6WI/UvJaS/2mdSHsXvZiJMNJUkOkiL+JQBzBNFQ6YpETzsQGYSGZuhWSETSDaZJ+G4Mx/eRE0K7aDbOemWqpdZHHkwQE4BGXggHNQA9egDhqAgCfwBj7Ap/VsvVtf1vfUmrOymX3wp3K5HxGOr9o=</latexit><latexit sha1_base64="Pob2G+bQd3UnquOBQ0Q5f2CKrX8=">AAACSHicbVDLSgMxFM3UV62vqks3wSLUhUOm1MdGKLhxWcE+oC0lk2baYCYzJhmxDPN5bly68xvcuFDEnZl2Ctp6IdzDOedyb44bcqY0Qq9Wbml5ZXUtv17Y2Nza3inu7jVVEElCGyTggWy7WFHOBG1opjlth5Ji3+W05d5dpXrrgUrFAnGrxyHt+XgomMcI1obqF/tdT2ISdxUb+jgx/V7qWCRJ4RLOlJRBdvWs7Jyk7TiZ2aoIGWMXh6EMHjM7sk+TuILMPLJR5bTQL5YMmBRcBE4GSiCrer/40h0EJPKp0IRjpToOCnUvxlIzwqlZFykaYnKHh7RjoMA+Vb14EkQCjwwzgF4gzRMaTtjfEzH2lRr7rnH6WI/UvJaS/2mdSHsXvZiJMNJUkOkiL+JQBzBNFQ6YpETzsQGYSGZuhWSETSDaZJ+G4Mx/eRE0K7aDbOemWqpdZHHkwQE4BGXggHNQA9egDhqAgCfwBj7Ap/VsvVtf1vfUmrOymX3wp3K5HxGOr9o=</latexit>

Page 15: 11. 標本平均と母平均 (1) - GitHub Pages...統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群 今日の目標

標準誤差の例(2)

ππ ± 1.96SE

n=25

女性の標本比率

確率密度

0.2 0.4 0.6 0.8

05

1015

n=100

女性の標本比率

確率密度

0.2 0.4 0.6 0.8

05

1015

n=400

女性の標本比率

確率密度

0.2 0.4 0.6 0.8

05

1015

Page 16: 11. 標本平均と母平均 (1) - GitHub Pages...統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群 今日の目標

母集団の大きさと標本サイズ(1)

• 都道府県ごとに増税に賛成か反対か調べたい

- 東京都の人口:約1300万人

- 岩手県の人口:約130万人

‣ 東京の標本サイズは岩手の標本サイズの10倍にするべき?

!16

Page 17: 11. 標本平均と母平均 (1) - GitHub Pages...統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群 今日の目標

母集団の大きさと標本サイズ(2)

• 仮に、東京でも岩手でもちょうど半分の人が増税に賛成(反対)だとする

• 標本サイズを100にすると

- 東京の標準誤差 = 0.5/10 = 0.05

- 岩手の標準誤差 = 0.5/10 = 0.05

• 母集団の人口が10倍でも、同じ標本サイズで同じ精度の調査ができる

➡(母集団が十分大きいとき)標本誤差は母集団の大きさに依存しない!

!17

Page 18: 11. 標本平均と母平均 (1) - GitHub Pages...統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群 今日の目標

母集団の大きさと標本サイズ(3)

• Good news:東京の調査を岩手と同じ精度で行うためには、岩手と同じサイズの標本を抽出すればよい

• Bad news:岩手の調査を東京の調査と同じ精度にするためには、東京と同じサイズの標本を抽出しなければならない

!18

Page 19: 11. 標本平均と母平均 (1) - GitHub Pages...統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群 今日の目標

標本平均と母平均•標本平均:標本から求められる平均値(統計量)

• 母平均:母集団の平均値(母数)

• 例:日本の成人男性(母集団)の身長を知るために、単純無作為抽出で1000人抽出した

- 標本平均:1000人の身長の平均値

- 母平均:日本の成人男性身長の平均値(未知、興味の対象)

推測する!

!19

Page 20: 11. 標本平均と母平均 (1) - GitHub Pages...統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群 今日の目標

標本平均と母平均の差

• 標本平均の誤差 = 標本平均 - 母平均

• 「標本平均 = 母平均」になるとは限らない

➡ 標本平均には誤差がある

➡ 標本平均は分布する!

!20

Page 21: 11. 標本平均と母平均 (1) - GitHub Pages...統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群 今日の目標

標準誤差 ≤ 母標準偏差

• 標準誤差 ≤ 母標準偏差

➡標本平均のばらつき ≤ 母集団のばらつき

• なぜ?

- シミュレーションで示す

!21

Page 22: 11. 標本平均と母平均 (1) - GitHub Pages...統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群 今日の目標

標本分布のシミュレーション

★母集団の身長が平均170、 標準偏差5.5の正規分布に従うことを知っているとする

★このとき、標本平均の分布をシミュレーションで手に入れる(標本の数 [標本サイズではない!] =10万)

• 目的:標本平均のばらつきが母集団のばらつき以下になる理由を理解する

!22

Page 23: 11. 標本平均と母平均 (1) - GitHub Pages...統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群 今日の目標

標本サイズ(n)が1のとき

• 標本平均は標本として抽出された値そのもの

• 標準誤差

➡「標本平均のばらつき=母集団のばらつき」になるはず

!23

SE =�pn=

�p1= �

<latexit sha1_base64="TGHRG+aP04HWRROzHMDu9nE0im4=">AAACMXicdVBLSwMxGMzWV62vqkcvwSJ4KrtV0ItQEKHHivYB3aVk02wbmmTXJCuUZf+SF/+JeOlBEa/+CbPtHrTVgZBh5vtIZvyIUaVte2oVVlbX1jeKm6Wt7Z3dvfL+QVuFscSkhUMWyq6PFGFUkJammpFuJAniPiMdf3yd+Z1HIhUNxb2eRMTjaChoQDHSRuqXGy5HeiR5cneTwivoBhLhxFV0yFFq7gepE5H+5zhzZ6b1yxW7as8Al4mTkwrI0eyXX9xBiGNOhMYMKdVz7Eh7CZKaYkbSkhsrEiE8RkPSM1QgTpSXzBKn8MQoAxiE0hyh4Uz9uZEgrtSE+2Yyy6cWvUz8y+vFOrj0EiqiWBOB5w8FMYM6hFl9cEAlwZpNDEFYUvNXiEfIVKNNySVTgrMYeZm0a1XnrFq7Pa/U63kdRXAEjsEpcMAFqIMGaIIWwOAJvII38G49W1Prw/qcjxasfOcQ/IL19Q0csqtb</latexit>

Page 24: 11. 標本平均と母平均 (1) - GitHub Pages...統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群 今日の目標

標本サイズ(n)が2のとき

• 標本平均は標本として抽出された2つの値の平均値

• 標準誤差

➡「標本平均のばらつき=母集団のばらつきの約0.7倍」になるはず

!24

SE =�pn=

�p2⇡ 0.7�

<latexit sha1_base64="H2WPCbY59r8n3QF128sBivPSVJA=">AAACPHicdVBLSwMxGMzWV62vqkcvwSJ4KrtVqBehIILHSu0DukvJptk2NMmuSVYsy/4wL/4Ib568eFDEq2fTdg/a6kDIMPN9JDN+xKjStv1s5ZaWV1bX8uuFjc2t7Z3i7l5LhbHEpIlDFsqOjxRhVJCmppqRTiQJ4j4jbX90MfHbd0QqGoobPY6Ix9FA0IBipI3UKzZcjvRQ8qRxmcJz6AYS4cRVdMBRau5bqROR/udUjOOiKJLhPYR2uQpndq9Yssv2FHCROBkpgQz1XvHJ7Yc45kRozJBSXceOtJcgqSlmJC24sSIRwiM0IF1DBeJEeck0fAqPjNKHQSjNERpO1Z8bCeJKjblvJidR1bw3Ef/yurEOzryEiijWRODZQ0HMoA7hpEnYp5JgzcaGICyp+SvEQ2Ra0qbvginBmY+8SFqVsnNSrlyflmq1rI48OACH4Bg4oApq4ArUQRNg8ABewBt4tx6tV+vD+pyN5qxsZx/8gvX1DWUPr1g=</latexit>

Page 25: 11. 標本平均と母平均 (1) - GitHub Pages...統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群 今日の目標

標本サイズ(n)が10のとき

• 標本平均は標本として抽出された10個の値の平均値

• 標準誤差

➡「標本平均のばらつき=母集団のばらつきの約0.3倍」になるはず

!25

SE =�pn=

�p10

⇡ 0.3�<latexit sha1_base64="3y0aI5nCw8bfkt1yek3RuDpaAHo=">AAACPHicdVBLSwMxGMzWV62vqkcvwSJ4KrutoBehIILHSu0DukvJptk2NMmuSVYsy/4wL/4Ib568eFDEq2ezbQ/a6kDIMPN9JDN+xKjStv1s5ZaWV1bX8uuFjc2t7Z3i7l5LhbHEpIlDFsqOjxRhVJCmppqRTiQJ4j4jbX90kfntOyIVDcWNHkfE42ggaEAx0kbqFRsuR3ooedK4TOE5dAOJcOIqOuAoNfet1IlI/3Mc21guiiIZ3kO7XIVTu1cs2WV7ArhInBkpgRnqveKT2w9xzInQmCGluo4daS9BUlPMSFpwY0UihEdoQLqGCsSJ8pJJ+BQeGaUPg1CaIzScqD83EsSVGnPfTGZR1byXiX953VgHZ15CRRRrIvD0oSBmUIcwaxL2qSRYs7EhCEtq/grxEJmWtOm7YEpw5iMvklal7FTLleuTUq02qyMPDsAhOAYOOAU1cAXqoAkweAAv4A28W4/Wq/VhfU5Hc9ZsZx/8gvX1DXQJr2M=</latexit>

Page 26: 11. 標本平均と母平均 (1) - GitHub Pages...統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群 今日の目標

標準誤差の特徴

• 標準誤差の大きさは、標本サイズn の平方根に反比例する

- nを4倍にすれば、SE は半分になる!

➡ n が大きいほど、統計的推測が正確になる(大数の法則による)

!26

Page 27: 11. 標本平均と母平均 (1) - GitHub Pages...統計学 2 11. 標本平均と母平均 (1) 矢内 勇生 2019年5月23日 高知工科大学 経済・マネジメント学群 今日の目標

今日のまとめ• 大数の法則:標本サイズが大きくなるほど、誤差が小さくなる

• 標本には誤差がつきもの

- 標本分布と標準誤差

- 「平均すれば」うまく推定できる

- しかし、1つひとつの標本平均は信用できない

- では、どうする?(次回のテーマ)

!27