第五章统计原理 § 5.1 数理统计的基本概念 5.1.1 总体和样本在实际中，我们把研究对象的全体组成的集合称为总体；组成总体的每一个元素称为个体；总体的一个子集称为样本。

第五章统计原理 §5.1 数理统计的基本概念

5.1.1 总体和样本在实际中，我们把研究对象的全体组成的集合称为

总体；组成总体的每一个元素称为个体；总体的一个子集称为样本。

在数学上，我们把随机变量 X 称为总体，并把随机变量 X 的概率分布称为总体分布；把相互独立且与总体 X 同分布的随机变量（ X1 ， X2 ，…， Xn ）称为来自总体 X 的一个简单随机样本； n 称为样本容量；把样本（ X1 ， X2 ，…， Xn ）的每一个具体值

（ x1 ， x2 ，…， xn ）称为样本（ X1 ， X2 ，…， X

n ）的一组样本观测值或样本实现。5.1.2 统计量设（ X1 ， X2 ，…， Xn ）是来自总体 X 的一个简单

随机样本，称样本的函数 T=g （ X1 ， X2 ，…， X

n ）为统计量，如果它不依赖于任何未知参数。统计量的具体值亦称做统计量的实现。

几个常用的统计量：1 、样本均值

n

iiX

nX

1

1

2 、样本方差

3 、样本标准差

4 、样本 k 阶原点矩

n

ii XX

nS

1

22 )(1

1

n

ii XX

nS

1

2)(1

1

n

i

kik X

na

1

1

5 、样本 k 阶中心矩

6 、顺序统计量最小统计量

最大统计量

极差

n

i

kik XX

n 1

)(1

},,,min{ 21)1( nXXXX

},,,max{ 21)( nn XXXX

)1()( XXR n

例 1 设假设总体 X 服从参数为 p （ 0<p<1 ）的 0-1

分布， p 未知。（ X1 ， X2 ，…， X5 ）是来自 X

的简单随机样本。

（ 1 ）指出 X1+X3 ， min （ X1 ， X2 ，…， X5 ）， X

5+2p （ X5 -X2 ）， X2-EX4 ，（ X3-X5 ） 2 ，中哪些是统计量，哪些不是统计量？

（ 2 ）如果（ 0 ， 1 ， 0 ， 1 ， 1 ）是一个样本值，求样本均值和样本方差。

例 2 设一个样本由六个 6 ，七个 7 ，八个 8 ，九个9 和十个 10 组成．求样本容量，样本均值、样本方差和样本极差。

例 3 设某地区抽样调查 200 个居民家庭，得到月支出的统计资料如下：

月支出（千元） 1~2 2~3 3~4 4~5 5~6 6~7 7~8

家庭数 18 35 76 24 19 14 14

求样本均值和样本方差近似值。5.1.3 经验分布函数对于任意实数 x ，设 μn 表示样本（ X1 ， X2 ，…，

Xn ）的 n 个观察值中不大于 x 的观察值的个数，则 μn 表示在对总体 X 的 n 次独立重复观测中，事件 {X≤x} 出现的次数。因此在对总体 X 的 n 次独立重复观测中，事件 {X≤x} 出现的频率

n

xxF n

n

)()(

称为总体 X 的经验分布函数或样本分布函数。对于给定的样本值（ x1 ， x2 ，…， xn ），经验分布

函数具有分布函数的一切性质，经验分布函数也是一个阶梯型的函数；经验分布函数依概率收敛于总体的分布函数。

经验分布函数依概率收敛于总体的分布函数这个结论，为进行统计推断提供了依据。

例 4 根据例 1 （ 2 ）和例 2 中的数据，分别求其经验分布函数。

§5.2 抽样分布5.2.1 χ2 分布设（ X1 ， X2 ，…， Xn ）是来自正态总体 N （ 0 ，

1 ）的样本，称统计量 χ2 =X1

2+X22+…+Xn

2

服从自由度为 n 的 χ2 分布，记为 χ2 ~ χ2 （ n ）。χ2 分布上 α 分位点：对于给定的 α （ 0<α<1 ），称满

足条件

为 χ2 （ n ）分布的上 α 分位点。

)}(P{ 22 n

5.2.2 t 分布随机变量 X~N （ 0 ， 1 ）， Y~χ2 （ n ），且 X 和 Y 相

互独立，则称随机变量

服从自由度为 n 的 t 分布，记为 T~t （ n ）。t 分布上 α 分位点：对于给定的 α （ 0<α<1 ），称满足

条件

为 t （ n ）分布的上 α 分位点。

nY

XT

)}(P{ ntt

5.2.3 正态总体的抽样分布设（ X1 ， X2 ，…， Xn ）是来自正态总体 N （ μ ， σ

2 ）的一个样本，则（ 1 ）样本均值（ 2 ）随机变量

（ 3 ）样本均值和样本方差相互独立（ 4 ）随机变量

),(~ nNX 2

)1(~)(1)1( 2

1

222

22

nXXSn n

ii

)1(~

ntnS

XT

例 5 设总体 X 服从 N （ 0 ， 0.32 ），（ X1 ， X2 ，…，X10 ）是来自 X 的一个容量为 10 的样本，求概率

例 6 假设一种电子元件的使用寿命 X （小时）服从正态分布 N （ 3000 ， 8002 ）。一名顾客购买了 50 个元件，试求这 50 个元件的平均使用寿命超过 3250的概率。

}44.1P{10

1

2

i

iX

§5.3 参数估计5.3.1 统计估计的概念在统计中，估计既表示由样本特征求总体特征的过

程，也表示由样本求得的总体特征的估计值。一、参数估计和非参数估计可以用有限个参数表示的估计问题，统称为参数估

计，否则称为非参数估计。二、参数估计的方法参数估计有两种基本类型：点估计和区间估计。

点估计，也称“定值估计”，既可以指用统计量的值做为未知参数的估计值，也可以指用来估计未知参数的统计量。

区间估计是指根据估计可靠程度的要求，由样本确定总体参数的一个区间范围。

5.3.2 参数的点估计最常用的点估计方法：矩估计法和极大似然估计法。一、矩估计法矩估计法是用样本矩来估计总体矩，用样本矩的函数

来估计总体矩的相应函数的一种估计方法。

例 7 设总体 X 服从参数为 λ 的指数分布，其中 λ未知。（ X1 ， X2 ，， Xn ）是来自 X 的简单随机样本，求 λ的矩估计量。

例 8 设 X 为任意总体， EX =μ ， DX =σ2 ＞ 0 存在，但未知。（ X1 ， X2 ，， Xn ）是来自总体 X 的简单随机样本，求 μ 和 σ2 的矩估计量。

二、极大似然估计法设总体 X 的概率密度为 f （ x,θ ）（当 X 为离散型时，

f （ x,θ ） =P{X=x} ，即为概率分布），其中 θ 为待估参数。设（ x1 ， x2 ，， xn ）为样本（ X1 ， X

2 ，， Xn ）的一组观测值，称

为似然函数。对于给定的样本观测值（ x1 ， x2 ，， xn ），使

似然函数 L （ θ ）达到最大值的参数值，称为未知参数 θ 的极大似然估计值，相应的统计量称为未知参数 θ 的极大似然估计量。

极大似然估计量，可以用微积分中求函数的极大值的方法来求．不过，这里求的不是函数的极大值，而求是函数的极大值点。

n

iin xfxxxL L

121 );();,,,()(

由于 lnx 是 x 的严格单增函数，因此 L(θ) 和 ln L(θ) 在同一处取极大值，因此我们也称 ln L(θ) 为似然函数。

求极大似然的一般步骤：（ 1 ）由总体分布写出似然函数 L(θ) 和 ln L(θ) ；（ 2 ）求似然函数关于 θ 的导数：

如果分布含有多个未知参数（ θ1 ， θ2 ，…， θr ），这时似然函数就是这些未知参数的函数，由方程组

0d

)(lnd

L

（ 3 ）解上述方程可以得到参数 θ 的极大似然估计。例 9 设总体 X 服从参数为（ 1/θ ）的指数分布，求

参数 θ 的极大似然估计量。若有一组样本值 340 ，410 ， 450 ， 520 ， 620 ， 190 ， 210 ， 800 ， 270 ， 500 ，求 θ 的极大似然估计值。

0)(ln

0)(ln

1

r

L

L

例 10 设总体 X 服从参数为 p 的 0-1 分布，求参数 p的极大似然估计量。

若从一大批产品中，用还原方法抽取了 50 件产品，发现其中有 2 件是次品，求 p 的极大似然估计值。

例 11 假设总体 X～ N （ μ ， σ2 ）， μ 与 σ2都未知．试根据来自 X 的简单随机样本（ X1 ， X2 ，， X

n ），求 μ 与 σ2 的极大似然估计量。

三、评价估计量的标准1 、无偏性设是未知参数 θ的估计量，如果 E =θ ，则称是

θ 的无偏估计量。例 12 设 X 为任意总体， EX =μ ， DX = σ2 存在。（ X

1 ， X2 ，， Xn ）是来自总体 X 的简单随机样本，证明（ 1 ）样本均值是 μ 的无偏估计量；（ 2 ）样本方差是 σ2 的无偏估计量。

2 、有效性设与为未知参数 θ的两个无偏估计量，如果

D <D

则称是比有效的估计量。在未知参数的任意两个无偏估计中，显然应该选更有效

的，即方差较小的。3 、一致性设为未知参数 θ 的估计量，如果依概率收敛于 θ ，

则称是 θ 的一致估计量。

1 2

12

1 2

例 13 设 X 为任意总体，其 k 阶原点矩 ak= EXk （ k ＞0 ）存在。设（ X1 ， X2 ，， Xn ）是来自总体 X

的简单随机样本，证明样本 k 阶原点矩是总体 k 阶原点矩 ak 的无偏与一致估计量。

5.3.3 正态总体参数的区间估计一、区间估计的概念未知参数 θ的区间估计，也称置信区间，是以统计

量为端点，以充分大的概率包含未知参数 θ值的随机区间。

n

i

kik X

na

1

1

设 θ 是总体 X 的未知参数，（ X1 ， X2 ，， Xn ）是来自总体 X 的简单随机样本。对给定的数 α （ 0＜ α＜ 1 ），如果存在两个统计量和，满足

则称（随机）区间称为参数 θ的区间估计或置信区间，称概率 1-α为置信区间的置信度（水平）。

二、一个正态均值 μ的置信区间1 、总体方差 σ2已知均值的 1-α为置信区间为

1 2

1}ˆˆ{P 21

)ˆ,ˆ( 21

其中 uα/2 为标准正态分布双侧分位数。例 14 某企业生产的滚珠直径 X 服从 N （ μ， 0.000

6 ）。现从产品中随机抽取 6颗进行检测，得到它们的平均值为 1.495cm ，标准差为 0.0226cm 。试求滚珠平均直径的置信水平为 0.95 的置信区间。

置信区间的长度 l 为

)( 2/2/n

uXn

uX

，

nul

22/

2 、总体方差 σ2 未知均值的 1-α为置信区间为

其中 tα/2 （ n-1 ）为 t （ n-1 ）分布双侧分位数。例 15 在例 14 中若总体方差未知，试求滚珠平均直径的置信水平为 0.95 的置信区间。

三、一个总体方差 σ2 的置信区间总体方差 σ2 的 1-α置信区间为

))1()1(( 2/2/n

SntX

n

SntX ，

其中是是自由度为 ν 的 χ2 分布水平 p 的上侧分位数。

标准差的 1-α置信区间为

)1(

)1(,

)1(

)1(2

2/1

2

22/

2

n

Sn

n

Sn

2 ,p

)1(

)1(,

)1(

)1(2

2/1

2

22/

2

n

Sn

n

Sn

例 16 从自动车床加工的一批零件中随机抽取了 16件，测得零件长度的平均值为 2.125cm ，标准差为 0.017cm 。假设零件的长度服从正态分布，求零件长度标准差的 0.95置信区间。

§5.4 假设检验一、假设检验的基本概念 1 、统计假设的概念统计假设是关于总体参数或数字特征、总体的分布

以及两个或两个以上总体之间的关系的一切论断或命题，简称假设。通常用字母“ H” 表示假设。

2 、统计假设的基本类型（ 1 ）参数假设与非参数假设可以用有限个参数表示的统计假设称为参数假设，

否则称为非参数假设。（ 2 ）原假设与备择假设两个二者必居其一的假设，其中一个称做原假设，习惯上记为 H0 ；而另一个称做备择假设，习惯上记为 H1 。原假设也称为零假设；备择假设也称为对立假设。

3 、统计假设的检验

统计假设的检验，简称假设检验，是指按照一定规则即检验准则，根据样本来判断所作假设的真伪，以决定接受还是否定假设。

（ 1 ）检验准则检验准则，简称为检验，指接受还是否定假设所

依据的规则。检验准则通常用原假设的否定域来表示。

否定域亦称拒绝域或临界域，假设 H0 的否定域是样本空间的一个区域 V ，当样本值落入区域 V 时，否定假设 H0 。

（ 2 ）假设检验的理论依据小概率原则。所谓小概率原则，就是根据具体问

题的要求，指定一个可以认为“充分小”的数 α（ 0<α<1 ），并且把概率不大于 α的事件认为是“实际不可能事件”，即认为这样的事件在一次试验或观测中实际上不会出现。

4 、假设检验的基本步骤（ 1 ）根据实际问题的要求提出原假设 H0 和备择假

设 H1 ，并且在作出最后的判断之前，将始终在假设 H0 成立的假定下进行分析；

（ 2 ）构造适当的检验统计量 J ，在假设 H0成立下，其分布已知；

（ 3）对给定的水平（ 0< <1），确定否定域 V ；（ 4）根据检验统计量 J 的观察值，作出统计决策。5、假设检验的两类错误否定了本来真实的假设，称为第一类（弃真）错误，犯这类错误的概率记为；

接受了本来错误的假设，称为第二类（存伪）错误，犯这类错误的概率记为 β。

二、一个总体参数的假设检验 1 、一个总体均值的假设检验（ 1 ）正态总体，方差 σ2已知

n

XU

/0

n

XU

/0

n

XU

/0

2/uu

双侧检验上侧检验下侧检验

假设 H0： μ=μ0

H1 ： μ≠μ0

H0 ： μ≤μ0

H1 ： μ ＞ μ0

H0 ： μ≥μ0

H1 ： μ＜ μ0

检验统计量

拒绝域 u ＞ uα u ＜ -uα

例 17 味精厂用一台包装机自动包装味精，包得的袋装味精重量服从 N （ μ ， 0.0152 ）。当机器正常时，其均值为 0.5kg 。某日开工后随机地抽取9袋味精，称得平均重量为 0.511kg ，问在显著性水平 0.05 下，这台包装机是否正常？

（ 2 ）正态总体，方差 σ2 未知

nS

XT

/0

nS

XT

/0

nS

XT

/0

)1(2/ ntt


假设 H0： μ=μ0

H1 ： μ≠μ0

H0 ： μ≤μ0

H1 ： μ ＞ μ0

H0 ： μ≥μ0

H1 ： μ＜ μ0

检验统计量

拒绝域 t ＞ tα(n-1) t ＜ - tα(n-1)

例 18 某厂生产的螺杆直径服从正态分布 N （ μ ， σ2 ）。现从中抽取 5 件，测得平均直径为 21.8mm ，标准差为 0.367mm 。若 σ2 未知，在显著性水平 0.05 下，检验假设 H0 ： μ=21 是否成立。

例 19 用某种农药施入农田种防治病虫害，经过三个月后，如果土壤中的浓度不低于 5ppm ，认为仍有残效。在一块已施药的农田中随机抽取 10 个土样进行分析，其浓度的平均值为 4.08ppm ，标准差为 1.80ppm 。假设土壤残余农药的浓度服从正态分布，在显著性水平 0.05 下，问该农药经过三个月后是否仍有残效？

（ 3 ）总体分布未知，但大样本情形

nS

XT

/0

nS

XT

/0

nS

XT

/0

2/ut


假设 H0： μ=μ0

H1 ： μ≠μ0

H0 ： μ≤μ0

H1 ： μ ＞ μ0

H0 ： μ≥μ0

H1 ： μ＜ μ0

检验统计量

拒绝域 t ＞ uα t ＜ - uα

例 20 某厂生产的一种型号的电阻元件其平均电阻一直保持在 2.64欧姆。改变生产工艺后，测得所生产的 100 个元件的平均电阻为 2.62欧姆，标准差为 0.06欧姆，在显著性水平 0.01 下，问新工艺对该电阻元件的生产有无显著影响？

2 、一个正态总体方差 σ2 的假设检验（自由度为 n-1 ）


假设 H0： σ=σ0

H1 ： σ≠σ0

H0 ： σ≤σ0

H1 ： σ ＞ σ0

H0 ： σ≥σ0

H1 ： σ＜ σ0

检验统计量

拒绝域2

21

2

2

12

20

22 )1(

Sn

20

22 )1(

Sn

2

2

2 或 22

20

22 )1(

Sn

例 21 设某厂生产的产品服从 N （ μ ， 0.0482 ）。今任取 5 件进行检测，得到其平均值为 1.414 ，方差为 0.00778 。问在显著性水平 0.1 下，能否认为总体的方差没有显著变化？

3 、一个总体比率的假设检验（大样本）

)1( 00

0

pnp

npU n

)1( 00

0

pnp

npU n

)1( 00

0

pnp

npU n

2/uu


假设 H0： p=p0

H1 ： p≠p0

H0 ： p≤p0

H1 ： p ＞ p0

H0 ： p≥p0

H1 ： p＜ p0

检验统计量

拒绝域 u ＞ uα u ＜ - uα

例 22 某厂生产了一批产品，按规定次品率不超过 0.05才能出厂，否则不能出厂。现从产品中随机抽取 50 件进行检查，发现有 4 件次品，问在显著性水平 0.05 下，该批产品能否出厂？

Documents

第五章 统计原理 § 5.1 数理统计的基本概念 5.1.1 总体和样本 在实际中，我们把研究对象的全体组成的集合称为总体；组成总体的每一个元素称为个体；总体的一个子集称为样本。

第五章统计原理 § 5.1 数理统计的基本概念 5.1.1 总体和样本在实际中，我们把研究对象的全体组成的集合称为总体；组成总体的每一个元素称为个体；总体的一个子集称为样本。