抽样估计是指利用实际调查的样本指标的数值来估计相应的总体指标的数值的方法。由于总体指标是表明总体数量特征的参数,例如总体平均数、总体成数等,所以抽样估计也称为参数估计。参数估计有点估计和区间估计两种方法。
一、点估计
点估计的基本特点是,根据样本资料计算样本指标,再以样本指标数值直接作为相应的总体指标的估计值。例如,以实际计算的样本平均数作为相应总体平均数的估计值;以实际计算的样本成数作为相应总体成数的估计值等等。设以样本平均数作为总体平均数的估计值,样本成数p作为总体成数P的估计值,则有
^p
其中
p
点估计的优点是原理直观,计算简便,在实际工作中经常采用。不足之处是这种估计方法没有考虑到抽样估计的误差,更没有指明误差在一定范围内的概率保证程度。因此,当抽样误差较小,或抽样误差即使较大也不妨碍对问题的认识和判断时,才可以使用这种方法。
二、区间估计
(一)区间估计的含义
区间估计的基本特点是,根据给定的概率保证程度F(t)的要求,利用实际样本资料,给出总体指标估计值的上限和下限,即指出可能覆盖总体指标的区间范围。也就是说,区间估计要解决两个问题:
第一,根据样本指标和误差范围估计出一个可能包括总体指标的区间,即确定出估计区间的上限和下限。
第二,确定出估计区间覆盖总体未知参数的概率保证程度。
区间估计的基本公式有
±Δ±tμ
即-tμ≤≤+tμ
Pp±Δpp±tμp
即p-tμp≤P≤p+tμp
从而得到总体平均数的估计区间:[-tμ,+tμ]
总体成数的估计区间:[p-tμp,p+tμp]
(二)区间估计的模式
在进行区间估计的时候,根据所给定条件的不同,总体平均数和总体成数的估计有以下两套模式可供选择使用。
1.根据已给定的误差范围,求概率保证程度。具体步骤是:
第一步,抽取样本,计算样本指标,即计算样本平均数或样本成数p,作为总体指标的估计值,并计算样本标准差s以推算抽样平均误差。
第二步,根据给定的抽样极限误差Δ,估计总体指标的上限和下限。
第三步,将抽样极限误差Δ除以抽样平均误差μ,求出概率度t,再根据t值查《正态概率表》求出相应的概率保证程度。
【例4】对工厂生产设备中某种型号的机械零件进行耐磨性能检验,耐磨时数的允许误差范围为10小时(Δ=10)。试估计这批机械零件的平均耐磨时数。
第一步,计算,s,μ:
1055.5(小时)
s51.91(小时)
μ5.191(小时)
(总体标准差σ以样本标准差s代替)
第二步,根据给定的Δx=10,计算总体平均数的上、下限:
下限=-Δ1055.5-101045.5(小时)
上限=+Δ1055.5+101065.5(小时)
第三步,根据t1.93,查《正态概率表》得概率保证程度F(t)=94.64%。
抽样推断的结论是:根据要求耐磨时数的允许误差范围为10小时,估计这批机械零件耐磨时数在[1045.5,1065.5],其概率保证程度为94.64%。
【例5】仍用,设该种型号零件质量标准规定,耐磨时数达1000小时以上为合格品,要求合格率估计的允许误差范围不超过4%,试估计该批机械零件的合格率。
第一步,计算p,s2p,μp:
p91%
s2pp(1-p)0.91×0.090.0819
μp2.86%
第二步,根据给定的Δp=4%,求总体合格率的上、下限:
下限=p-Δp91%-4%=87%
上限=p+Δp91%+4%=95%
第三步,根据t1.4,查《正态概率表》得概率F(t)=83.85%。
抽样推断的结论是:根据要求,合格率允许误差范围不超过4%,估计这批零件的合格率在[87%,95%],其概率保证程度为83.85%。
2.根据已给定的概率保证程度,求抽样极限误差。具体步骤是:
第一步,抽取样本,计算样本指标,即计算样本平均数或样本成数p,作为总体指标的估计值,并计算样本标准差s以推算抽样平均误差。
第二步,根据给定的概率保证程度F(t),查概率表求得概率度t值。
第三步,根据概率度t和抽样平均误差μ推算出抽样极限误差Δ,并根据抽样极限误差求出被估计总体指标的上限和下限。
【例6】对我国某中等城市进行居民家庭年人均旅游消费支出调查,随机抽取400户居民家庭,调查得知居民家庭年人均旅游消费支出额为400元,标准差为100元,要求以95%的概率保证程度,估计该市年人均旅游消费支出额。
第一步,根据已知资料算得
年人均旅游消费支出额=400(元)
样本标准差s=100(元)
μ5(元)
(总体标准差σ以样本标准差s代替)
第二步,根据给定的概率保证程度F(t)95%,查《正态概率表》得t=1.96。
第三步,计算Δ=tμx=1.96×5=9.80,则该市居民家庭年人均旅游消费支出额:
下限-Δ=400-9.80=390.20(元)
上限+Δ=400+9.80=409.80(元)
结论:在95%的概率保证程度下,估计该市居民家庭年人均旅游消费支出额在[390.20,409.80]。
【例7】为了解国内旅游人数情况,在一些地区随机调查5000人,结果发现800人有当年国内旅游计划,要求以95%的概率保证程度,估计国内旅游人数比率的可能范围。
第一步,根据已知资料算得
样本国内旅游人数比率p===16%
样本方差s2p=p(1-p)=0.16×0.84=0.1344
抽样平均误差μp0.518%
[P(1-P)用p(1-p)代替]
第二步,根据给定的概率保证程度F(t)=95%,查《正态概率表》得概率度t=1.96。
第三步,计算Δp=tμp1.96×0.518%=1.015%,则总体比率的上、下限为
下限=p-Δp=16%-1.015%14.985%
上限=p+Δp=16%+1.015%17.015%
结论:在95%的概率保证程度下,估计国内旅游人数的比率在[15%,17%]。