Click here to load reader
Upload
keefe-palmer
View
135
Download
17
Embed Size (px)
DESCRIPTION
第五章 统计原理 § 5.1 数理统计的基本概念 5.1.1 总体和样本 在实际中,我们把研究对象的全体组成的集合称为总体;组成总体的每一个元素称为个体;总体的一个子集称为样本。 在数学上,我们把随机变量 X 称为总体, 并把随机变量 X 的概率分布称为总体分布 ; 把相互独立且与总体 X 同分布的随机变量( X 1 , X 2 , … , X n )称为来自总体 X 的一个简单随机样本; n 称为样本容量;把样本( X 1 , X 2 , … , X n )的每一个具体值. - PowerPoint PPT Presentation
Citation preview
第五章 统计原理 §5.1 数理统计的基本概念
5.1.1 总体和样本 在实际中,我们把研究对象的全体组成的集合称为
总体;组成总体的每一个元素称为个体;总体的一个子集称为样本。
在数学上,我们把随机变量 X 称为总体,并把随机变量 X 的概率分布称为总体分布;把相互独立且与总体 X 同分布的随机变量( X1 , X2 ,…, Xn )称为来自总体 X 的一个简单随机样本; n 称为样本容量;把样本( X1 , X2 ,…, Xn )的每一个具体值
( x1 , x2 ,…, xn )称为样本( X1 , X2 ,…, X
n )的一组样本观测值或样本实现。5.1.2 统计量 设( X1 , X2 ,…, Xn )是来自总体 X 的一个简单
随机样本,称样本的函数 T=g ( X1 , X2 ,…, X
n )为统计量,如果它不依赖于任何未知参数。统计量的具体值亦称做统计量的实现。
几个常用的统计量:1 、样本均值
n
iiX
nX
1
1
2 、样本方差
3 、样本标准差
4 、样本 k 阶原点矩
n
ii XX
nS
1
22 )(1
1
n
ii XX
nS
1
2)(1
1
n
i
kik X
na
1
1
5 、样本 k 阶中心矩
6 、顺序统计量 最小统计量
最大统计量
极差
n
i
kik XX
n 1
)(1
},,,min{ 21)1( nXXXX
},,,max{ 21)( nn XXXX
)1()( XXR n
例 1 设假设总体 X 服从参数为 p ( 0<p<1 )的 0-1
分布, p 未知。( X1 , X2 ,…, X5 )是来自 X
的简单随机样本。
( 1 )指出 X1+X3 , min ( X1 , X2 ,…, X5 ), X
5+2p ( X5 -X2 ), X2-EX4 ,( X3-X5 ) 2 ,中哪些是统计量,哪些不是统计量 ?
( 2 )如果( 0 , 1 , 0 , 1 , 1 )是一个样本值,求样本均值和样本方差 。
例 2 设一个样本由六个 6 ,七个 7 ,八个 8 ,九个9 和十个 10 组成.求样本容量,样本均值、样本方差和样本极差。
例 3 设某地区抽样调查 200 个居民家庭,得到月支出的统计资料如下:
月支出(千元) 1~2 2~3 3~4 4~5 5~6 6~7 7~8
家庭数 18 35 76 24 19 14 14
求样本均值和样本方差近似值。5.1.3 经验分布函数 对于任意实数 x ,设 μn 表示样本( X1 , X2 ,…,
Xn )的 n 个观察值中不大于 x 的观察值的个数,则 μn 表示在对总体 X 的 n 次独立重复观测中,事件 {X≤x} 出现的次数。因此在对总体 X 的 n 次独立重复观测中,事件 {X≤x} 出现的频率
n
xxF n
n
)()(
称为总体 X 的经验分布函数或样本分布函数 。 对于给定的样本值( x1 , x2 ,…, xn ),经验分布
函数具有分布函数的一切性质,经验分布函数也是一个阶梯型的函数;经验分布函数依概率收敛于总体的分布函数。
经验分布函数依概率收敛于总体的分布函数这个结论,为进行统计推断提供了依据。
例 4 根据例 1 ( 2 )和例 2 中的数据,分别求其经验分布函数。
§5.2 抽样分布5.2.1 χ2 分布设( X1 , X2 ,…, Xn )是来自正态总体 N ( 0 ,
1 )的样本,称统计量 χ2 =X1
2+X22+…+Xn
2
服从自由度为 n 的 χ2 分布,记为 χ2 ~ χ2 ( n )。χ2 分布上 α 分位点:对于给定的 α ( 0<α<1 ),称满
足条件
为 χ2 ( n )分布的上 α 分位点。
)}(P{ 22 n
5.2.2 t 分布 随机变量 X~N ( 0 , 1 ), Y~χ2 ( n ),且 X 和 Y 相
互独立,则称随机变量
服从自由度为 n 的 t 分布,记为 T~t ( n )。t 分布上 α 分位点:对于给定的 α ( 0<α<1 ),称满足
条件
为 t ( n )分布的上 α 分位点。
nY
XT
)}(P{ ntt
5.2.3 正态总体的抽样分布 设( X1 , X2 ,…, Xn )是来自正态总体 N ( μ , σ
2 )的一个样本,则( 1 )样本均值 ( 2 )随机变量
( 3 )样本均值和样本方差相互独立( 4 )随机变量
),(~ nNX 2
)1(~)(1)1( 2
1
222
22
nXXSn n
ii
)1(~
ntnS
XT
例 5 设总体 X 服从 N ( 0 , 0.32 ),( X1 , X2 ,…,X10 )是来自 X 的一个容量为 10 的样本,求概率
例 6 假设一种电子元件的使用寿命 X (小时)服从正态分布 N ( 3000 , 8002 )。一名顾客购买了 50 个元件,试求这 50 个元件的平均使用寿命超过 3250的概率。
}44.1P{10
1
2
i
iX
§5.3 参数估计5.3.1 统计估计的概念 在统计中,估计既表示由样本特征求总体特征的过
程,也表示由样本求得的总体特征的估计值。 一、参数估计和非参数估计 可以用有限个参数表示的估计问题,统称为参数估
计,否则称为非参数估计。二、参数估计的方法 参数估计有两种基本类型:点估计和区间估计。
点估计,也称“定值估计”,既可以指用统计量的值做为未知参数的估计值,也可以指用来估计未知参数的统计量。
区间估计是指根据估计可靠程度的要求,由样本确定总体参数的一个区间范围。
5.3.2 参数的点估计 最常用的点估计方法:矩估计法和极大似然估计法。一、矩估计法 矩估计法是用样本矩来估计总体矩,用样本矩的函数
来估计总体矩的相应函数的一种估计方法。
例 7 设总体 X 服从参数为 λ 的指数分布,其中 λ未知。( X1 , X2 ,, Xn )是来自 X 的简单随机样本,求 λ的矩估计量 。
例 8 设 X 为任意总体, EX =μ , DX =σ2 > 0 存在,但未知。( X1 , X2 ,, Xn )是来自总体 X 的简单随机样本,求 μ 和 σ2 的矩估计量。
二、极大似然估计法 设总体 X 的概率密度为 f ( x,θ )(当 X 为离散型时,
f ( x,θ ) =P{X=x} ,即为概率分布),其中 θ 为待估参数。设( x1 , x2 ,, xn )为样本( X1 , X
2 ,, Xn )的一组观测值,称
为似然函数 。 对于给定的样本观测值( x1 , x2 ,, xn ),使
似然函数 L ( θ )达到最大值的参数值 ,称为未知参数 θ 的极大似然估计值,相应的统计量称为未知参数 θ 的极大似然估计量。
极大似然估计量,可以用微积分中求函数的极大值的方法来求.不过,这里求的不是函数的极大值,而求是函数的极大值点。
n
iin xfxxxL L
121 );();,,,()(
由于 lnx 是 x 的严格单增函数,因此 L(θ) 和 ln L(θ) 在同一处取极大值,因此我们也称 ln L(θ) 为似然函数。
求极大似然的一般步骤:( 1 )由总体分布写出似然函数 L(θ) 和 ln L(θ) ;( 2 )求似然函数关于 θ 的导数:
如果分布含有多个未知参数( θ1 , θ2 ,…, θr ),这时似然函数就是这些未知参数的函数,由方程组
0d
)(lnd
L
( 3 )解上述方程可以得到参数 θ 的极大似然估计。例 9 设总体 X 服从参数为( 1/θ )的指数分布,求
参数 θ 的极大似然估计量。若有一组样本值 340 ,410 , 450 , 520 , 620 , 190 , 210 , 800 , 270 , 500 ,求 θ 的极大似然估计值。
0)(ln
0)(ln
1
r
L
L
例 10 设总体 X 服从参数为 p 的 0-1 分布,求参数 p的极大似然估计量。
若从一大批产品中,用还原方法抽取了 50 件产品,发现其中有 2 件是次品,求 p 的极大似然估计值。
例 11 假设总体 X~ N ( μ , σ2 ), μ 与 σ2都未知.试根据来自 X 的简单随机样本( X1 , X2 ,, X
n ),求 μ 与 σ2 的极大似然估计量。
三、评价估计量的标准1 、无偏性 设 是未知参数 θ的估计量,如果 E =θ ,则称 是
θ 的无偏估计量。例 12 设 X 为任意总体, EX =μ , DX = σ2 存在。( X
1 , X2 ,, Xn )是来自总体 X 的简单随机样本,证明( 1 )样本均值是 μ 的无偏估计量;( 2 )样本方差是 σ2 的无偏估计量。
2 、有效性 设 与 为未知参数 θ的两个无偏估计量,如果
D <D
则称 是比 有效的估计量。在未知参数的任意两个无偏估计中,显然应该选更有效
的,即方差较小的。3 、一致性设 为未知参数 θ 的估计量,如果 依概率收敛于 θ ,
则称 是 θ 的一致估计量。
1 2
12
1 2
例 13 设 X 为任意总体,其 k 阶原点矩 ak= EXk ( k >0 )存在。设( X1 , X2 ,, Xn )是来自总体 X
的简单随机样本,证明样本 k 阶原点矩 是总体 k 阶原点矩 ak 的无偏与一致估计量。
5.3.3 正态总体参数的区间估计一、区间估计的概念 未知参数 θ的区间估计,也称置信区间,是以统计
量为端点,以充分大的概率包含未知参数 θ值的随机区间。
n
i
kik X
na
1
1
设 θ 是总体 X 的未知参数,( X1 , X2 ,, Xn )是来自总体 X 的简单随机样本。对给定的数 α ( 0< α< 1 ),如果存在两个统计量 和 ,满足
则称(随机)区间 称为参数 θ的区间估计或置信区间,称概率 1-α为置信区间的置信度(水平)。
二、一个正态均值 μ的置信区间1 、 总体方差 σ2已知 均值的 1-α为置信区间为
1 2
1}ˆˆ{P 21
)ˆ,ˆ( 21
其中 uα/2 为标准正态分布双侧分位数。例 14 某企业生产的滚珠直径 X 服从 N ( μ, 0.000
6 )。现从产品中随机抽取 6颗进行检测,得到它们的平均值为 1.495cm ,标准差为 0.0226cm 。试求滚珠平均直径的置信水平为 0.95 的置信区间。
置信区间的长度 l 为
)( 2/2/n
uXn
uX
,
nul
22/
2 、总体方差 σ2 未知 均值的 1-α为置信区间为
其中 tα/2 ( n-1 )为 t ( n-1 )分布双侧分位数。例 15 在例 14 中若总体方差未知,试求滚珠平均直径的置信水平为 0.95 的置信区间。
三、一个总体方差 σ2 的置信区间 总体方差 σ2 的 1-α置信区间为
))1()1(( 2/2/n
SntX
n
SntX ,
其中 是是自由度为 ν 的 χ2 分布水平 p 的上侧分位数。
标准差的 1-α置信区间为
)1(
)1(,
)1(
)1(2
2/1
2
22/
2
n
Sn
n
Sn
2 ,p
)1(
)1(,
)1(
)1(2
2/1
2
22/
2
n
Sn
n
Sn
例 16 从自动车床加工的一批零件中随机抽取了 16件,测得零件长度的平均值为 2.125cm ,标准差为 0.017cm 。假设零件的长度服从正态分布,求零件长度标准差的 0.95置信区间。
§5.4 假设检验一、假设检验的基本概念 1 、统计假设的概念 统计假设是关于总体参数或数字特征、总体的分布
以及两个或两个以上总体之间的关系的一切论断或命题,简称假设。通常用字母“ H” 表示假设。
2 、统计假设的基本类型 ( 1 )参数假设与非参数假设 可以用有限个参数表示的统计假设称为参数假设,
否则称为非参数假设。( 2 )原假设与备择假设 两个二者必居其一的假设,其中一个称做原假设,习惯上记为 H0 ;而另一个称做备择假设,习惯上记为 H1 。原假设也称为零假设;备择假设也称为对立假设。
3 、统计假设的检验
统计假设的检验,简称假设检验,是指按照一定规则即检验准则,根据样本来判断所作假设的真伪,以决定接受还是否定假设。
( 1 )检验准则 检验准则,简称为检验,指接受还是否定假设所
依据的规则。检验准则通常用原假设的否定域来表示。
否定域亦称拒绝域或临界域,假设 H0 的否定域是样本空间的一个区域 V ,当样本值落入区域 V 时,否定假设 H0 。
( 2 )假设检验的理论依据 小概率原则。所谓小概率原则,就是根据具体问
题的要求,指定一个可以认为“充分小”的数 α( 0<α<1 ),并且把概率不大于 α的事件认为是“实际不可能事件”,即认为这样的事件在一次试验或观测中实际上不会出现。
4 、假设检验的基本步骤( 1 )根据实际问题的要求提出原假设 H0 和备择假
设 H1 ,并且在作出最后的判断之前,将始终在假设 H0 成立的假定下进行分析;
( 2 )构造适当的检验统计量 J ,在假设 H0成立下,其分布已知;
( 3)对给定的水平( 0< <1),确定否定域 V ;( 4)根据检验统计量 J 的观察值,作出统计决策。5、假设检验的两类错误 否定了本来真实的假设,称为第一类(弃真)错误,犯这类错误的概率记为 ;
接受了本来错误的假设,称为第二类(存伪)错误,犯这类错误的概率记为 β。
二、一个总体参数的假设检验 1 、一个总体均值的假设检验 ( 1 )正态总体,方差 σ2已知
n
XU
/0
n
XU
/0
n
XU
/0
2/uu
双侧检验 上侧检验 下侧检验
假设 H0: μ=μ0
H1 : μ≠μ0
H0 : μ≤μ0
H1 : μ > μ0
H0 : μ≥μ0
H1 : μ< μ0
检验统计量
拒绝域 u > uα u < -uα
例 17 味精厂用一台包装机自动包装味精,包得的袋装味精重量服从 N ( μ , 0.0152 )。当机器正常时,其均值为 0.5kg 。某日开工后随机地抽取9袋味精,称得平均重量为 0.511kg ,问在显著性水平 0.05 下,这台包装机是否正常?
( 2 )正态总体,方差 σ2 未知
nS
XT
/0
nS
XT
/0
nS
XT
/0
)1(2/ ntt
双侧检验 上侧检验 下侧检验
假设 H0: μ=μ0
H1 : μ≠μ0
H0 : μ≤μ0
H1 : μ > μ0
H0 : μ≥μ0
H1 : μ< μ0
检验统计量
拒绝域 t > tα(n-1) t < - tα(n-1)
例 18 某厂生产的螺杆直径服从正态分布 N ( μ , σ2 )。现从中抽取 5 件,测得平均直径为 21.8mm ,标准差为 0.367mm 。若 σ2 未知,在显著性水平 0.05 下,检验假设 H0 : μ=21 是否成立。
例 19 用某种农药施入农田种防治病虫害,经过三个月后,如果土壤中的浓度不低于 5ppm ,认为仍有残效。在一块已施药的农田中随机抽取 10 个土样进行分析,其浓度的平均值为 4.08ppm ,标准差为 1.80ppm 。假设土壤残余农药的浓度服从正态分布,在显著性水平 0.05 下,问该农药经过三个月后是否仍有残效?
( 3 )总体分布未知,但大样本情形
nS
XT
/0
nS
XT
/0
nS
XT
/0
2/ut
双侧检验 上侧检验 下侧检验
假设 H0: μ=μ0
H1 : μ≠μ0
H0 : μ≤μ0
H1 : μ > μ0
H0 : μ≥μ0
H1 : μ< μ0
检验统计量
拒绝域 t > uα t < - uα
例 20 某厂生产的一种型号的电阻元件其平均电阻一直保持在 2.64欧姆。改变生产工艺后,测得所生产的 100 个元件的平均电阻为 2.62欧姆,标准差为 0.06欧姆,在显著性水平 0.01 下,问新工艺对该电阻元件的生产有无显著影响?
2 、一个正态总体方差 σ2 的假设检验(自由度为 n-1 )
双侧检验 上侧检验 下侧检验
假设 H0: σ=σ0
H1 : σ≠σ0
H0 : σ≤σ0
H1 : σ > σ0
H0 : σ≥σ0
H1 : σ< σ0
检验统计量
拒绝域2
21
2
2
12
20
22 )1(
Sn
20
22 )1(
Sn
2
2
2 或 22
20
22 )1(
Sn
例 21 设某厂生产的产品服从 N ( μ , 0.0482 )。今任取 5 件进行检测,得到其平均值为 1.414 ,方差为 0.00778 。问在显著性水平 0.1 下,能否认为总体的方差没有显著变化?
3 、一个总体比率的假设检验(大样本)
)1( 00
0
pnp
npU n
)1( 00
0
pnp
npU n
)1( 00
0
pnp
npU n
2/uu
双侧检验 上侧检验 下侧检验
假设 H0: p=p0
H1 : p≠p0
H0 : p≤p0
H1 : p > p0
H0 : p≥p0
H1 : p< p0
检验统计量
拒绝域 u > uα u < - uα
例 22 某厂生产了一批产品,按规定次品率不超过 0.05才能出厂,否则不能出厂。现从产品中随机抽取 50 件进行检查,发现有 4 件次品,问在显著性水平 0.05 下,该批产品能否出厂?