抽样分布与参数估计和假设检验

抽样分布

常见抽样分布的总结

分布函数 数学形式 均值 方差 性质 图像
正态分布 XN(μ,σ2) μ σ2
卡方分布 设随机变量X1,X2,,Xn相互独立,且Xi(i=1,2,,n)服从标准正态分布N(0,1),则他们的平方和i=1nXi2服从自由度为n的χ2分布,记为χ2(n) n 2n (1)可加性
(2)当n时,极限分布为正态分布
(3)当自由度n>45时,2χ2(n)近似服从N(2n1,1)χp2(n)12(μp+2n1)2
t分布 设随机变量XN(0,1),Yχ2(n),且X与Y相互独立,则t=XY/n,记为t(n) n2时,E(t)=0 n3时,nn2 (1)t(n)的方差比N(0,1)要大一些
(2)自由度为1的t分布称为柯西分布,期望不存在
(3)当n30,认为近似标准正态分布
F分布 设随机变量Y与Z相互独立,且Y和Z分别服从自由度为m和n的χ2分布,则X=Y/mZ/n=nYmZ,服从第一自由度为m,第二自由度为n的F分布 nn2,n>2 2n2(m+n2)m(n2)(n4),n>4 (1)Fp(v1,v2)=1F1p(v2,v1)
(2)如果随机变量X服从t(n)分布,则X2服从F(1,n)分布
中心极限定理 不管总体的分布是什么,样本均值X的分布总是近似正态分布,只要总体的方差σ2有限,x¯μσ/nN(0,1) 0 1 (1)通常认为n30时为大样本(2)大样本,小样本实际并不是以样本量大小来区分的,在样本固定的条件下所进行的推断统计,问题分析不管样本量有多大,都成为小样本问题;在样本量n的条件下进行的统计推断,问题分析则成为大样本问题。

服从各种分布的统计量的构建

统计量 分布 推导 条件
x¯μσ/n N(0,1) E(x¯)=E(1ni=1nXi)=1ni=1nE(Xi)=1nnμ=μ D(x¯)=D(1ni=1nXi)=1n2i=1nD(Xi)=1n2nσ2=σ2n x¯μσ/nN(0,1) (1)大样本(近似正态分布)
(2)μ,σ已知
(n1)s2σ2 χ2(n1) x¯μσ/nN(0,1) (x¯μ)2σ2/nχ2(n1) s2=1n1i=1n(Xix¯)2 D((n1)s2σ2)=2(n1)D(s2)=2σ4n1 (n1)s2=i=1nXi22i=1nXix¯+i=1nx¯2=i=1nXi2nx¯2 i=1n(Xix¯)2σ2N(0,1) x¯μ,, (1)正态分布总体或者大样本
(2)σ已知
x¯μs/n t(n1) x¯μσ/nN(0,1) (n1)s2σ2χ2(n1) x¯μσ/n(n1)s2σ2(n1)=x¯μs/nt(n1) (1)正态总体或大样本
(2)μ已知
s12/s22σ12/σ22 F(n11,n21) (n1)s2σ2χ2(n1) (n11)s12σ12(n11)/(n21)s22σ22(n21)=s12/s22σ12/σ22 (1)正态总体或大样本
(2)σ1,σ2已知

参数估计

各种情况下的参数估计总结

参数 统计量 分布 点估计值 标准误差 (1α)%的置信区间 假定条件
μ总体均值 x¯μσ/n N(0,1) x¯ σn x¯±zα2σn (1)σ已知
(2)大样本(n>=30)
x¯μσ/n N(0,1) x¯ σn x¯±zα2sn (1)σ未知
(2)大样本(n>=30)
x¯μs/n t(n-1) x¯ σn x¯±tα2sn (1)正态总体
(2)σ未知
(3)小样本(n<30)
π总体比例 z=pππ(1π)/n N(0,1) p π(1π)n p±zα2p(1p)n (1)二项总体
(2)大样本
(np5,n(1p)5)
σ2 (n1)s2σ2 χ2(n1) s2 不要求 (n1)s2χα/22σ2(n1)s2χ1α/22 正态总体
μ1μ2两个总体均值之差 z=(x¯1x¯2)(μ1μ2)σ12n1+σ22n2 N(0,1) x¯1x¯2 σ12n1+σ22n2 (x¯1x¯2)±zα/2σ12n1+σ22n2 (1)独立大样本
(n130,n230)
(2)σ1,σ2已知
z=(x¯1x¯2)(μ1μ2)σ12n1+σ22n2 N(0,1) x¯1x¯2 σ12n1+σ22n2 (x¯1x¯2)±zα/2s12n1+s22n2 (1)独立大样本
(n130,n230)
(2)σ1,σ2已知
t=(x¯1x¯2)(μ1μ2)sp1n1+1n2 t(n1+n22) x¯1x¯2 σ12n1+σ22n2 (x¯1x¯2)±tα/2(n1+n22)sp2(1n1+1n2) (1)两个正态总体
(2)独立小样本
(n130,n230)
(3)σ1,σ2未知但相等
t=(x¯1x¯2)(μ1μ2)s12n1+s22n2 t(v) x¯1x¯2 σ12n1+σ22n2 (x¯1x¯2)±tα/2(v)s12n1+s22n2 (1)两个正态总体
(2)独立小样本
(n130,n230)
(3)σ1,σ2未知且不相等
μd=μ1μ2两个总体均值之差 z=d¯μdσd/n N(0,1) d¯ σdn d¯±zα/2σdn (1)匹配大样本
(n130,n230)
z=d¯μdsd/n t(n-1) d¯ σdn d¯±tα/2(n1)sdn (1)两个正态总体
(2)匹配小样本
(n130,n230)
π1π2两个总体比例之差 Z=(p1p2)(π1π2)π1(1π1)n1+π2(1π2)n2 N(0,1) p1p2 π1(1π1)n1+π2(1π2)n2 (p1p2)±zα/2p1(1p1)n1+p2(1p2)n2 (1)两个二项总体
(2)大样本
(n1p15,n1(1p1)5
n2p25,n2(1p2)5)
σ12σ22两个总体方差之比 F=s12s22σ22σ12 F(n11,n21) s12s22 不要求 s12/s22Fα/2σ12σ22s12/s22F1α/2 两个正态总体

参数估计的基本原理

参数估计是为了估计一个总体的参数

通过构造统计量(估计量),从而利用样本来预测总体的参数,利用具体的样本算出来的统计量称为估计值。

点估计就是用估计值来估计总体参数

区间估计是构造服从一定分布的含未知参数的(但是注意这个参数被视作一个常数)统计量来估计总体参数的范围,当我们得知一个统计量的分布时,我们就可以得到它任一分位点的值,就可以得到该统计量一定范围区间的值(被称作置信水平),从而反推出此时参数的取值范围(被称作置信区间,最小值被称为置信下限,最大值被称为置信上限)。

  • 置信水平α(置信度,置信系数):

    主观设定的值,取决于我们希望这个置信区间应该多宽,当样本量给定时,置信区间的宽度随着置信系数的增大而增大,置信区间越大,肯定越可靠。但是太宽的置信区间没有意义

    这个水平是针对某个随机区间而言,我们永远不能说参数在某个具体区间内的概率为α

  • 置信区间

    置信区间的解释是在n次抽样中,包含参数的区间的概率为α,包含参数的区间个数为nα

    参数在一个区间的概率非1即0,在或者不在。α是统计量的分布概率,参数本身不存在概率分布,也就无法说参数在该置信区间的概率是α

估计量的评价标准

指标 解释 图像
无偏性 估计量的期望等于参数
有效性 估计量的方差大小,越小越有效
一致性 随着样本量的增大,估计量的值越来越接近被估计总体的参数。比如样本均值抽样分布的标准差为σn,当n时,方差为0,无限接近均值

样本量的确定

在样本量确定的情况下,我们不可能同时提高预测精度和可靠度,但是样本量也不可能无限增大,我们要找到最优的样本量。

思路是参数估计的估计误差的表达式已经知道,则确定某个误差,我们可以反推样本量,样本量取较大的整数(样本量的元整法则)

参数 样本量表达式 关系
总体均值 n=(zα/2)2σ2E2 (1)与置信水平成正比,置信水平越大,所需样本量越大
(2)与总体方差成正比
(3)与估计误差的平方成反比,可接受的估计误差的平方越大,所需样本量越小。(4)方差未知可以用样本方差代替
总体比例 E=zα/2π(1π)n n=(zα/2)2π(1π)E2 可以用样本比例代替,
π无法知道时,取使π(1π)最大的0.5

假设检验

假设检验分情况讨论

原假设H0 检验统计量 拒绝域
μμ
μμ
μ=μ
(σ2)
Z=Xμ0σ/n zzα
zzα
z∣≥zα/2
μμ
μμ
μ=μ
(σ2)
t=Xμ0S/n ttα(n1)
ttα(n1)
t∣≤tα/2(n1)
μ1μ2δ
μ1μ2δ
μ1μ2=δ
(σ12,σ22)
Z=XYδσ12n1+σ22n2 zzα
zzα
z∣≥zα/2
μ1μ2δ
μ1μ2δ
μ1μ2=δ
(σ12=σ22=σ2)
t=XYδSω1n1+1n2
Sω2=(n11)S12+(n21)S22n1+n22
ttα(n1+n22)
ttα(n1+n22)
t∣≥tα/2(n1+n22)
σ2σ02
σ2σ02
σ2=σ02
(μ)
χ2=(n1)S2σ02 χ2χα2(n1)
χ2χ1α2(n1)
χ2χα/22(n1)χ2χ1α/22(n1)
σ12σ22
σ12σ22
σ12=σ22
(μ1,μ2)
F=S12S22 FFα(n11,n21)
FF1α(n11,n21)
FFα/2(n11,n21)FF1α/2(n11,n21)
μD0
μD0
μD=0
(成对数据)
t=D0SD/n ttα(n1)
ttα(n1)
t∣≤tα/2(n1)

假设检验的理解

参数估计是为了估计参数的范围,而假设检验是为了检验我们关于参数的假设值或者范围是否正确。这在实际生活中有很大的意义,我们希望来检测总体的参数有没有发生某些变化,假设检验给了我们科学的指导。

假设分为原假设,和备则假设。假设的检验有可能犯两类错误,一类是弃真(α错误),一类是取伪错误(β错误),而在实际应用中我们大多数选择让检验的弃真错误概率不超过α,所以实际上的犯错概率是要大于α

弃真错误和取伪错误此消彼长,

为什么选择弃真错误

  • 人为规定的统一标准
  • 原假设常常是明确的。我们更关心原假设为真,但是被我们拒绝了的可能性有多大

假设检验的根本原则

假设检验依据的是小概率原则,也就是我们认为小概率的事件在一次试验中是几乎不可能发生的。如果发生了,就认为原假设有问题,我们就可以拒绝原假设。

假设检验也是通过构造服从一定分布含假设参数的统计量,通过分布我们可以选定小概率区间,如果估计值落在了小概率区间内,则拒绝原假设。

单边检验和双边检验中拒绝域的选择

**其实就是找确定为小概率区间的值**,对于双边检验来说,要检验的参数值确定,不需要考虑小概率区间的变化,而对于单边检验来说,我们要找确定为小概率区间的区间。我们先假定

以上看法不对

单边检验就是找小概率区间来拒绝,但是双边检验是对问题的理解,比如关于μ,当原假设是大于问题时,此时我们将更关心下限问题,即当产品低于什么水平时拒绝,即x¯,{x}越低,统计量越小,所以选择下限检验。当原假设是小于问题时,此时我们更关心上限问题,即x¯越大,此时统计量越大。我们要选择上限检验

要理解,参数永远改变不了统计量的分布,统计量的分布是固定的,参数只是个常数,真正决定统计量分布的是样本。所以我们不管怎么假设参数实际上影响的使我们对于小概率区间的选择,而不是统计量的分布。统计量的小概率区间可以从两边或单边去选择。我们用样本去衡量x¯以及s2去衡量μ,σ2时,我们希望推翻原假设时,总体参数怎么变,然后就是样本的估计量应该相同趋势变化,然后作用到统计量上会怎么变化,此时我们就可以确定去上限还是上限了。统计量变大取上限,统计量变小取下限。

原假设和备则假设的关系

对于显著性水平为α的检验准则来说,保证了错误的拒绝原假设的概率不超过alpha,但是不知道错误的接受原假设的概率。原假设被拒绝代表“结论H1为真出错的概率不超过alpha”,实际可能更低及更有可能结论H1为真,因为H1可能被错误的当真。

在一次实验中,原假设是有优势的。所以有可能备则假设和原假设互换位置后,新的原假设同样被接受。

原假设和备则假设并不是非此即彼的关系,拒绝原假设可以认为原假设就是错误的,但是接受原假设不代表备则假设是错误的。只能说还没有充分的证据证明原假设是错误的。

原假设和备则假设的选择

双边检验一般选择清晰的假设作为原假设

单边检验中:我们往往把原有的、传统的观点或结论放在原假设,而把希望验证的,希望证明的去放在备则假设,这样就可以通过推翻原有的假设,而得出结论。

同时单边检验也受到背景的影响,我们可能根据过往的经验来判断原假设。

附录

sp的公式

当两个总体的方差σ12σ22未知但相等时,需要用两个样本的方差s12,s22来估计,这时,需要将两个样本的数据组合在一起,以给出总体方差的合并估计量sp2.

sp2=(n11)s12+(n21)s22n1+n22

v的公式

当两个总体的方差σ12σ22未知但不相等时,两个样本均值只差经标准化后近似服从自由度为v的t分布,自由度v的计算公式如下: v=(s12n1+s22n2)2(s12/n1)2n11+(s22/n2)2n21

样本均值和样本方差分布以及独立性的证明

定理:设随机样本X1,,Xn服从正态分布N(μ,σ2),样本均值X=i=1nXi/n,且样本方差S2=i=1n(XiX)2/(n1),则:

  1. XS2相互独立;
  2. x服从N(μ,σ2/2)
  3. (n1)S2/σ2服从卡方分布χn12

结论2易得,以下仅证明结论1和3。

证明:为证明结论1,首先给出三个引理如下:

引理1: 对任一Cov(XiX,X)=0

证明:注意到:

X=l=1n1nXl;XiX=l=1n(δil1n)Xl

这里δil=1,i=l;δil=0,il,从而

Cov(XiX,X)=σ2i=1n(δil1n)1n=σ2(1nn1n2)=0

引理2: 对任一$(X_i-,)服从二元正态分布.

证明:由引理1的证明可知:

X=(1/n,,1/n)T(X1,,Xn);XiX=(δil1/n,,δin1)(X1,,Xn)服从多元正态分布,而多元正态分布的线性变换仍然是正态分布,故此引理得证。

引理3: 对于二元正态分布,协方差为0等价于独立。

证明:协方差为0等价于联合密度等于边际密度乘积等价于独立,得证。

由上述引理1—3,易知对任一i,XiXX是相互独立的。而S2=i=1n(XiX)2/(n1)XiX,i=1,,n的函数,故仍与X独立。结论1得证。

接下来考虑结论3。注意到

i=1n(Xiμ)2σ2=i=1n[(XiX)+(Xμ)]2σ2=i=1n(XiX)2σ2+n(Xμ)2σ2

也就是

i=1n(Xiμ)2σ2=(n1)S2σ2+n(Xμ)2σ2

等式左边是n项独立标准正态分布的平方和,故服从χn2,而等式右边第二项是1项标准正态分布的平方和,故服从χ12。又由于等式右边的两项是相互独立的,故结论3得证。

上述证明的核心是基于多元正态分布的典型性质,即不相关和独立等价,从而我们仅需证明变量不相关即可,使得独立性的证明变得简单易懂。

样本方差与总体方差无偏性的证明

E(x¯)=E(1ni=1nxi)=1ni=1nE(xi)=1ni=1nμ=μE(s2)=E(i=1n(xix¯)2n1)=1n1i=1nE(xi2+x¯22xix¯)=1n1i=1n[D(x)+E(x)2+D(x¯)+E(x¯)22E(xi2+xij=1,jinxjn)]=1n1i=1n[σ2+μ2+σ2n+μ22σ2+μ2+(n1)μ2n]=1n1i=1n(n1nσ2)=σ2

自由度的介绍

自由度是指附加给独立的观测值的约束或限制的个数。从字面含义来看,自由度是指一组数据中可以自由取值的个数。当样本数据的个数是n时,若样本平均数x¯确定下来,则附加给n个观测值的限制个数是一个,因此只有n-1个数据可以自由取值,n-1就是他的自由度。

上一页
下一页