33
Chapter 6 Introduction to Infer ence 推推推推

Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

  • View
    231

  • Download
    2

Embed Size (px)

Citation preview

Page 1: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

Chapter 6

Introduction to Inference推論簡介

Page 2: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

Chapter 6 Introduction to Inference

• 6.1 Estimating with Confidence

• 6.2 Tests of Significance

• 6.3 Making Sense of Statistical Significance

• 6.4 Error Probabilities and Power

Page 3: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

統計推論• 根據樣本資料,提出特定方法描述母體,稱為統計推論 (Statistical Inference) 。

• 常見的統計推論:– 信賴區間 (confidence intervals) :對母體參數的估計。

– 顯著性檢定 (tests of significance) :對母體參數所能提供之證據的宣告。

• 統計推論是在資料為隨機樣本或是來自隨機實驗的假設前提下提出的。

Page 4: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

Section 6.1

Estimating with Confidence具信賴度的估計

Page 5: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

例題 6.1 NAEP 調查研究• National Assessment of Educational Progr

ess ( 全國性教育進展評量,簡記為 NAEP) 調查包括一份簡短測驗,內容有數量技能,涵括基礎算術及應用到實際問題的能力。測驗分數 0 ~ 500 分。– 233 分以上的人會加總兩張存款條上金額– 325 分以上的人會判別菜單上一份餐的金額– 375 分以上的人會將每盎司 (ounce) 幾分 (ce

nts) 轉換成每磅 (pound) 幾元 (dollars)

Page 6: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

樣本資料• 一份含 840 個樣本,由全體 21~25 歲男性中隨機抽出。這 840 個男性的 NAEP ( 樣本 ) 平均成績為 。

• 這樣的結果,可以對全體九千五百萬個21~25 歲男性的平均成績 做什麼推論?

Page 7: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

大數法則推論• 根據大數法則,隨機大樣本之樣本均數

會很接近母體均數 。• 因此用樣本平均成績 來估計全體平均成績 。

• 即全體九千五百萬個 21~25 歲男性的平均成績 大大大。

Page 8: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

樣本平均數的變異• 取很多份樣本數為 840 的隨機樣本,則樣本平均成績 的變異如何?

• 根據中央極限定理,隨機大樣本之樣本平均數分配近似常態。– 此近似常態的平均數與原母體平均數相同。– 近似常態的變異數為原母體變異數 2 大大

大大,大樣本平均數的變異數為 2 。• 假設原標準差 為 60 ,則近似常態的標準差為 。

Page 9: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

樣本平均數的分配• 取很多組樣本數為 840 的隨機樣本,樣本平均成績分別為 = 272, =268, = 273, etc. 其直方圖可呈現樣本均數的分配。

Population

= ?

= 60

SRS n = 840

SRS n = 840

SRS n = 840

Page 10: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

樣本平均數的分配圖形

的值

的樣本分配

未知參數

Page 11: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

統計信賴度(Statistical Confidence)

• 根據常態 68-95-99.7 規則, 95% 樣本組的樣本均數 會落在母體均數 的兩個標準差之間。即 95% 的 落在 。

• 95% 的樣本組,根據樣本平均數計算出的區間 會包括母體平均數 。

Page 12: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

樣本平均數的信賴區間 (Confidence Interval)

• 取很多組樣本數為 840 的隨機樣本,根據樣本均數 及公式 計算出這些區間中,有 95% 會包括母體均數。

Population

= ?

= 60

SRS n = 840

SRS n = 840

SRS n = 840

Page 13: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense
Page 14: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

95% 信賴區間圖示的樣本分配

未知參數

機率 = 0.95

Page 15: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

信賴區間之一般型式 (form)

• 未知參數的信賴水準 (confidence level) C 之信賴區間,或稱為 100C % 信賴區間,為:– 區間型式為

估計量 ± 誤差域(estimate ± margin of error)

– 在重覆取樣下,估計區間 ( 視為隨機區間 )會包括未知參數的機率,即為信賴水準 C 。

Page 16: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

單組樣本 z 統計量• 常態母體均數為 標準差為 ,則樣本平均數 服從 。

• 標準化之統計量

服從標準常態,稱為單組樣本 z 統計量。

Page 17: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

常態母體平均數 之信賴區間

• 常態母體均數 之 100C % 信賴區間的求法:– 標示出常態曲線下中央面積為 C 的區域, 邊界值稱為臨界值 (critical value) ,記為 z* 。

– 即 z 介於 ± z* 之間的機率為 C 。

Page 18: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

例題 6.3 80% 之信賴區間圖示

標準常態曲線

0 1.28

機率 = 0.8

z*=1.28

機率 = (1-0.8)/2=0.1機率 = 0.1

Page 19: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

常態母體平均數 之信賴區間

• 常態母體平均數 之 80 % 信賴區間:

Page 20: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

常態平均數 之信賴區間圖示

標準常態曲線

0 z*

機率 = C

z*

機率 = (1-C)/2

機率 = (1-C)/2

Page 21: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

母體平均數 之信賴區間• 母體平均數 大大標準差 大大,抽出一組樣本數為 n 之隨機樣本,則 之 100C % 信賴區間為 (z*可由表 C 查得 )

• 若母體為常態,則為正確的 (exact) 信賴區間。在其他情況,樣本數 n 夠大時為近似信賴區間。

Page 22: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

常用之信賴水準及臨界值

Page 23: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

例題 6.4 製藥的分析• 藥廠對每一組產品樣本分析其成份濃度。• 假設每一樣本重複測度的結果接近常態。• 分析程序無偏差,成份分析結果可估計真正的母體濃度平均數 。

• 已知標準差為 = 0.0068 公克 / 公升。• 實驗室提供每一樣本 3 次的成份分析結果。

Page 24: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

例題 6.4( 續 )

• 某一樣本 3 次成份濃度分析重複測度的結果如右: 0.8403, 0.8363, 0.8447

– 樣本平均數

• 母體均數 之 99 % 信賴區間– 由表 C 查得 z* = 2.576

– 99 % 信賴區間為 [0.8303, 0.8505]

Page 25: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

信賴水準的意義• 99 % 的信賴水準的意義如下:

每一份樣本 3 次成份濃度分析重複測度的結果,可得到一個母體平均數 之 99 % 信賴區間大則 100 份樣本使用同樣的方法算出的 100 個 99 % 信賴區間中,其中大約有 99 個信賴區間包含了真正的母體均數 大

Page 26: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

例題 6.4 (再續 )

• 假設只用一次濃度分析的結果: 0.8404– 樣本平均數

• 則母體均數 之 99 % 信賴區間

– 99 % 信賴區間為 [0.8229, 0.8579]

Page 27: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

圖 6.7

• n 越大信賴區間越短。

0.84 0.85 0.860.830.82

n = 1

n = 3

Page 28: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

信賴區間的行為 (behavior)

• 信賴區間的中心位置由樣本平均數決定。• 信賴區間寬度之一半稱為誤差域 (margin of er

ror) m

– 臨界值 z* :信賴水準越高 z*越大,信賴區間越寬。

– 標準差: 越大,信賴區間越寬。– 樣本數 n : n 越大,信賴區間越窄。

Page 29: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

例題 6.5 改變誤差域• 例題 6.4 之信賴度由 99%改為 90% , z

* 由 2.576改為 1.645 。樣本平均數與變異數仍然相同。

• 信賴區間為

– 90 % 信賴區間為 [0.8339, 0.8469]– 誤差域由 ± 0.0101 變為 ± 0.0065 。

Page 30: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

圖 6.8

• 信賴度越高,信賴區間越寬。

0.84 0.85 0.860.830.82

90% 信賴度

99% 信賴度

Page 31: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

樣本數的選擇• 給定誤差域 m 及信賴水準,可查表求得臨界值 z* ,則在已知標準差時可計算所需要的樣本數。

Page 32: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

例題 6.6 需要多少樣本數?• m = 0.005, 信賴水準 95% ,臨界值 z*

=1.96 , = 0.0068 ,則所需要的樣本數為 7.1 以上。

• 取 n = 8

Page 33: Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense

一些注意事項• 資料必須是從母體中隨機抽樣取得的。• 因為 會被一些極端觀察值強烈的影響,所以離群值對信賴區間有很大的影響作用。

• 區間完全倚靠於 的分配。– 如果母體不為常態而且樣本很小,真正的信賴水準會與計算區間時的信賴度不相同。

– 當 n ≧15,除非有極端的離群值或是相當強烈的不對稱,信賴水準不會因母體非常態而大受影響。

• 必須知道母體的標準差 σ。這個不切實際的假設使得區間 在統計實務上用處較小。