一、标志变异指标的意义
(一)标志变异指标的概念
标志变异指标是指反映总体中各单位标志值差异程度的综合指标,又称标志变动度。标志变异指标与平均指标之间具有相互联系、相互对应的关系。平均指标表现为总体各单位标志值的一般水平,反映各单位标志值的集中趋势;而标志变异指标则表现为总体各单位标志值的变异程度,反映各单位标志值的离中趋势。只有将两者结合起来,才能更加全面、深入地认识所研究现象的总体。
(二)标志变异指标的作用
1.标志变异指标可以说明平均指标的代表性
平均指标作为总体各单位标志值一般水平的代表性指标,其代表性大小与标志变异指标的大小成反比关系,即标志变异指标越大,平均指标的代表性越小;标志变异指标越小,平均指标的代表性越大。
【例25】对某班20名学生按性别分成两组,同时进行某门课程的期中测验,试根据下面两组学生得分情况,比较分析两组学生平均成绩的代表性。
女生组:68707276808285888990
男生组:60626365768895969798
通过计算平均指标可知,男、女生组的平均成绩相等,均为80分,表明从平均意义上说,男、女生组的平均成绩无差异。但从男、女生组各自的成绩分布来看,明显可见女生组成绩的分布较均匀,男生组的成绩则相差较大。显然平均成绩80分对女生组的代表性比对男生组的代表性大得多。
2.标志变异指标可以说明现象变动的稳定性、均衡性
计算同类总体的标志变异指标,并进行比较,可以观察标志值变动的稳定程度或均衡状态。例如,观察工业企业的生产情况,在研究生产计划完成程度的基础上,利用标志变异指标可以测定生产过程的均衡性;另外,测定产品质量的稳定性也需要利用标志变异指标。
3.标志变异指标的大小有助于确定必要的样本单位数
进行抽样调查时,为了合理地利用人力、财力、物力和时间,应正确地确定必要的样本单位数(内容详见第七章抽样推断),抽取的样本单位数过多或过少都会影响样本平均指标的代表性。而标志变异指标的大小可以帮助我们正确地确定必要的样本单位数。
二、标志变异指标的计算与分析
标志变异指标主要有:全距、平均差、标准差、变异系数等。
(一)全距
全距是指总体各单位标志值中两个极端数值,即最大值与最小值之差,故也称之为“极差”,用符号R来表示,其计算公式为
未分组资料或单项式数列资料:R=最大标志值-最小标志值
分组资料:R≈最高组的上限-最低组的下限
【例26】仍以【例25】中的资料为例,采用全距指标来判别男、女两组学生平均成绩的代表性。计算全距如下:
女生组:R90-6822(分)
男生组:R98-6038(分)
两组平均成绩都为80分,但从全距来看,男生组成绩的变异程度大,女生组成绩的变异程度小。显然平均成绩80分对女生组的代表性强于男生组。
全距反映了总体各单位标志值的变动范围。它的优点是计算简便,意义明确,能准确地反映总体中两极的差距。所以在实际工作中应用十分广泛,如在工业企业的产品质量管理中、证券市场的行情分析中都有广泛应用。
但全距仅表示总体各单位标志值的变动范围,没有包括中间各标志值的变异情况,也无法反映变量数列的次数分布情况,是对变异程度较粗略的反映。因此,它不能反映总体各单位标志值的变异程度,也不能很好地反映平均指标的代表性。
(二)平均差
平均差是总体各单位标志值与其算术平均数离差的绝对值的算术平均数,用符号“A?D”来表示。计算平均差的目的是测算各单位标志值与其算术平均数离差的大小。因为离差有正、有负,还可能是零,所以,为了避免加总过程中的正负抵消,计算平均差时要取离差的绝对值。根据所掌握资料的不同,平均差可分为简单平均差和加权平均差。
1.简单平均差
如果掌握的资料是未分组资料,则可计算简单平均差。一般分两个步骤来完成:
第一步,求各单位标志值与其算术平均数离差的绝对值;
第二步,将离差的绝对值之和除以项数。
其计算公式为
A?D
【例27】根据【例25】中男、女生组的成绩资料,计算简单平均差,并据此评价各组平均成绩的代表性。
女生组:A?D6.8(分)
男生组:A?D14.8(分)
可见,女生组成绩的平均差是6.8分,男生组成绩的平均差是14.8分,男生组成绩的平均差明显地大于女生组。这说明女生组平均成绩的代表性要强于男生组。
2.加权平均差
如果掌握的资料是分组资料,则可计算加权平均差。其计算公式为
A?D
【例28】利用,计算加权平均差。(2800元/人)
根据,可得加权算术平均数为2800元/人,加权平均差为
A?D225(元/人)
计算结果表明,该商场日销售额的加权平均差为225元/人。一般而言,平均差越大,标志变异程度越大,平均数代表性越小;反之,平均数代表性越大。
从计算过程可知,平均差的计算考虑了研究总体中所有标志值的差异程度,所以可以准确而综合地反映总体的离散程度。但每项平均差的计算都必须取绝对值,这就带来了不便于进行数学处理的问题,因而在实际应用中受到了很大的限制。
(三)标准差
1.标准差的概念
标准差也称为均方差,标准差的平方称为方差。标准差是总体各单位标志值与其算术平均数离差平方的算术平均数的算术平方根。它是标志变异指标中最重要、最常用的指标,用符号σ表示。
2.标准差的计算
标准差的计算可分为四步:
第一步,计算各单位标志值与其算术平均数的离差;
第二步,将各离差进行平方;
第三步,将离差平方和除以离差项数,计算出方差;
第四步,计算方差的平方根,即为标准差。
根据所掌握资料的不同,标准差可分为简单标准差和加权标准差。
(1)简单标准差。当掌握的资料是未分组资料时,可采用如下公式计算简单标准差:
σ
【例29】以【例25】中的考试成绩为例,计算简单标准差,并据此评价各组平均成绩的代表性。
单位:分
根据,女生组成绩的简单标准差为
σ7.73(分)
男生组成绩的简单标准差为
σ15.53(分)
可见女生组成绩的标准差是7.73分,男生组成绩的标准差是15.53分,男生组成绩的标准差明显大于女生组。这说明女生组平均成绩的代表性要强于男生组。
(2)加权标准差。当掌握的资料是分组资料时,可采用如下公式计算加权标准差:
σ
【例30】仍以,说明加权标准差的计算。
(x2800元/人)
根据,加权算术平均数2800元/人,计算加权标准差为
σ291.55(元/人)
3.标准差的特点
标准差具有平均差的优点,即它将总体中各单位标志值的差异全部包括在内,可以准确地反映总体的离散程度;同时标准差还避免了求平均差时存在的取绝对值的问题,能够适合于代数运算等数学处理。由于标准差的这些优点,在实际工作中一般都用它来测定总体的离散程度,其应用十分广泛。
但标准差都是用有名数表示的平均差异程度,它们的数值受平均指标数值大小的影响。当总体平均指标数值比较大时,标准差的数值就大;反之,标准差的数值就小。因此,在比较不同平均水平下的总体变异程度时,还需引入其他变异指标。
(四)变异系数
变异系数又称为离散系数,是指标志变异指标与其算术平均数之比的百分数。主要有全距系数、平均差系数和标准差系数等,其中最常用的是标准差系数。
标准差系数,是标准差与其算术平均数对比的相对数。其计算公式为
Vσ×100%
和()。
A.反映的是同一个问题
B.反映的不是同一个问题
C.是从绝对数上对总体分布特征的测定
D.是从相对数上对总体分布特征的测定
E.一个是从绝对数上,另一个是从相对数上对总体分布特征的测定【例31】某班两组学生英语考试成绩见。请说明两组学生平均成绩的代表性哪个大?为什么?
通过计算可知,一组学生的平均成绩是77.2分,二组学生的平均成绩是75.4分。两组成绩的标准差分别为6.6453分和3.3226分。根据标准差系数公式,得出
Vσ1×100%×100%8.6%
Vσ2×100%×100%4.4%
显然二组的标准差系数小于一组,即二组成绩的变异程度低于一组,所以二组平均成绩的代表性高于一组。
标准差系数的重要特点是:不受计量单位和标志值水平的影响,消除了不同总体之间在计算单位、平均水平方面的不可比性。
附录 应用Excel计算描述统计量
在本章中,我们主要介绍了各种综合指标的概念和计算方法,尤其是平均指标(集中趋势)和变异指标(离散程度)等常用统计量的计算方法,下面将介绍如何应用Excel操作方法来计算描述统计量。
一、使用未经处理的原始数据资料计算描述统计量
(一)应用Excel中“数据分析”工具计算描述统计量
【例32】将第三章【例3】中生产车间50名工人日加工零件的数据输入到Excel工作表的A1:A50单元格中,应用Excel“数据分析”工具计算描述统计量。
具体操作步骤如下:
第一步:点击“工具”下拉菜单,选择“数据分析”选项。
第二步:出现“数据分析”对话框后,选择“描述统计”,点击“确定”按钮。
第三步:出现“描述统计”对话框后,在“输入区域”中输入“A1:A50”;“分组方式”选择“逐列”;在“输出区域”中输入“C1”;选择“汇总统计”;在“平均数置信度”中输入“95”;其他选项为空,点击“确定”按钮。输出应用Excel计算的描述统计量相关数据,并将其按统计表的格式要求做简单整理,结果。
输出的描述统计量中,隶书体字显示的是本章已介绍过的描述统计量,而本章讲述的调和平均数、几何平均数在本图中没有反映,对于这些统计量可应用Excel的函数工具计算求得。
(二)应用Excel函数工具计算描述统计量
在Excel中既可手工创建公式计算各种描述统计量,也可应用Excel中的统计函数来计算。
一般操作步骤如下:
首先,选择放置函数值的单元格。
其次,点击“插入”下拉菜单,选择“函数”选项。
再次,出现“插入函数”对话框后,在“选择类别”里选择“统计”;在“选择函数”中选择所要计算函数的英文名称。
最后,按函数计算要求输入相应的信息,点击“确定”按钮,生成所要求得的描述统计量。
为了方便同学们应用Excel函数工具计算描述统计量,下面对常用描述统计量函数的英文名称做以简要介绍。其中包括:平均值(AVERAGE)、中位数(ME DIAN)、众数(MODE)、调和平均数(HARMEAN)、几何平均数(GEOMEAN)等平均指标函数;平均差(AVEDE)、样本标准差(STDEV)、总体标准差(STDEVP)、样本方差(VAR)、总体方差(VARP)等标志变异指标函数;最大值(MAX)、最小值(MIN)等极值函数。
【例33】仍以第三章【例3】为例,将某企业生产车间50名工人日加工零件的数据输入到Excel工作表的A1:A50单元格中。
要求:
1.应用Excel函数工具计算平均值、中位数、众数、调和平均数、几何平均数等平均指标函数。
2.应用Excel函数工具计算总体标准差、样本标准差等标志变异指标函数。
由于应用Excel函数工具计算函数值的操作方法大致相同,所以现仅以计算平均值(AVERAGE)为例,说明应用Excel函数工具计算函数值的操作方法。
具体操作步骤如下:
第一步,首先选择C3单元格。
第二步,点击“插入”下拉菜单,选择“函数”选项。
第三步,出现“插入函数”对话框后,在“选择类别”里选择“统计”,在“选择函数”中选取平均值函数“AVERAGE”,点击“确定”按钮。
第四步,出现“函数参数”对话框后,在“Number1”中输入“A1:A50”,点击“确定”按钮,生成平均数函数值,计算结果。
其他函数值的计算依次按上述操作方法完成。为简化描述统计量计算过程,我们构造描述统计量的工作表,以汇总本例题中其他描述统计量函数的操作方法。
表中A列为样本数据,C列为描述统计量函数名称,D列为输入各统计函数的语法结构后得到的输出结果,E列为让读者看清楚公式,给出各统计函数的语法结构。
二、使用分组数据资料计算描述统计量
使用分组数据资料,应用Excel软件来计算描述统计量时,通常方法是在单元格中输入描述统计量的计算公式来计算。因为公式是Excel的核心功能之一,所以它使Excel工作表具有“计算”能力,我们只需输入原始数据,进一步的计算用公式来实现,准确快速又方便。
(一)计算公式的编辑
1.公式三要素
(1)“=”号:这是公式的标志。
(2)操作符:表示执行哪种运算,有关操作符含义为:“+”加法;“-”减法;“*”乘法;“/”除法;“%”百分比;“^”乘方。
(3)数:引用的单元格、函数及常数。
2.公式输入
【例34】根据中某公司产品销售金额资料,计算该公司A产品年销售额。
具体操作步骤如下:
第一步,选定单元格F3。
第二步,在单元格F3中输入公式“B3+C3+ D3+E3”,敲击“回车”键,得到计算结果。
3.公式复制
如果要继续计算B、C、D产品年销售金额,可以继续向F4、F5、F6中输入类似公式,但是这样做显然比较麻烦。为此,Excel提供了非常简单的手段,即公式复制。公式复制是Excel中非常重要的功能,利用公式复制使带有“重复性”的操作得以简化,实现了过去只能编写程序才能完成的功能。公式复制最简便的操作是利用单元格填充句柄。
一般操作步骤如下:
第一步:在某一单元格中输入公式。
第二步:鼠标指向此单元格的填充句柄,向下(或上、左、右等方向)复制。
例如,按上述方法实施,则单元格F4~F6中分别因“复制公式”而得到“B4+C4+ D4+E4”、“B5+C5+ D5+E5”、“B6+C6+ D6+E6”等公式,并输出相应的计算结果。
公式在复制时应注意以下几个问题:
首先,公式必须以“=”号开始。
其次,如果公式输入不正确,Excel会报错。
最后,注意引用单元格的方法。引用单元格的方法有:相对引用、绝对引用和混合引用。
(1)相对引用。相对引用是指单元格(或单元格区域)引用相对于包含公式的单元格的位置。即在复制包含相对引用的公式时,Excel将自动调整复制公式中的引用,以便引用相对于当前公式位置的其他单元格。在上面的示例中,单元格F3中含有公式为“B3+C3+ D3+E3”,把F3公式复制至单元格F4~F6时,其中的公式自动改为“B4+C4+ D4+E4”;“B5+C5+ D5+E5”;“B6+C6+ D6+E6”。
(2)绝对引用。如果在复制公式时希望单元格坐标不随引用位置不同而变化,那么应使用绝对引用。绝对引用的格式是在单元格“行”或“列”前加上“”符号或是按一次“F4”键。
【例35】以【例34】为例,公司收集市场信息,为下一步生产做出正确决策,所以需计算产品年销售额占公司年总销售额的百分比指标来加以分析。
具体操作步骤如下:
第一步,在单元格G3中输入公式“F3/F7*100”后,敲击“回车”键,得到计算结果。
第二步,应用单元格填充句柄功能复制G3公式。即先选中单元格G3,然后应用填充句柄功能向下拖拽鼠标至G6,得到计算结果。并在G4~G6单元格的编辑栏内显示如下公式:“F4/F7*100”、“F5/F7*100”和“F6/F7*100”。
G3公式中单元格F7必须采用绝对引用形式,写成“F7”形式,因为公式无论如何复制,公式中分式的分母所在单元格的坐标是不会发生变化的。
通过上述计算可知:C产品年销售额所占的比例最高,达到64.46%,其次是A产品,而 B、BD产品年销售比例最少,应综合分析销售状况的影响因素(生产能力、市场需求、市场份额、产品质量、品牌效应等等),为公司下一步生产安排做出正确决策。
(3)混合引用
在某些情况下,复制时只想保留原公式中引用的单元格“行”固定不变或者是“列”固定不变,这时,可以使用混合引用,即同时包含绝对引用和相对引用。
例如,在引用“H5”中,“”符号保持“列”不变,但“行”没有限制,自动调整相对于新的复制单元格。“H5”的情况正好相反,“列”调整到新单元格位置,而“行”还是固定在第5行不变。所以可以使用创建绝对引用的方法创建混合引用:输入“”符号或者按“F4”键循环选择一种组合。
(二)计算公式的应用
【例36】以本章【例30】为例说明应用Excel来计算加权标准差。具体操作步骤及计算结果。为方便读者看清楚计算过程,图中列示相关指标的计算公式。
中数值区域E4:K4中的数据是在输入第10行提供的计算公式后计算求得的,数值区域E5:I8中的数据是在复制单元格E4~I4的计算公式后计算求得的,数值区域C9:I9中的部分数据是通过应用“SUM(求和公式)”计算求得的。