登陆注册
42901700000016

第16章 分配数列

一、分配数列的概念与种类

将总体按某一标志进行分组,并按一定顺序排列出每组的总体单位数,所得到的数列称为分配数列,又称次数分配或次数分布。在分配数列中,分布在各组的总体单位数叫做次数,又称频数。各组次数与总次数之比称为比率,又称频率。由此可见,分配数列有两个组成要素:一个是分组,另一个是次数或频率。分配数列是统计整理的结果,是进行统计描述和统计分析的重要方法。它可以表明总体分布特征及内部结构情况,并可据此研究总体单位某一标志的平均水平及其变动的规律性。分配数列根据分组标志的性质不同,可以分为品质数列和变量数列。

(一)品质数列

它是按品质标志分组形成的用来观察总体单位中不同属性的单位分布情况的数列。例如,我国2000年第五次人口普查中,人口按民族、性别、籍贯等分组所形成的数列都属于品质数列。

品质数列的编制比较简单,但要注意在分组时,应包括分组标志的所有表现,不能有遗漏,各种表现要互相独立,不得相融。

(二)变量数列

它是按数量标志分组形成的用来观察总体中不同变量值在各组的分布情况的数列。变量分为离散型变量和连续型变量。对这两类变量,在编制变量数列时,其方法是不相同的:对于连续型变量一般只能按组距式分组,即以变量值的一定变动范围为一组,编制组距式变量数列;对于离散型变量一般按单项式分组,即将每个变量值作为一组,编制单项式变量数列(简称单项数列,参见)。但在实际应用时,如果连续型变量的变量值数目不多,数值变动幅度不大,就可以编制单项式变量数列;如果离散型变量的变量值数目很多,又无法一一列举,就可以编制组距式变量数列。

在组距式变量数列中,需要明确以下各要素:

1.组限。组距式变量数列中,各组的界限称为组限。组限分为上限和下限。下限是每组最小的标志值,上限是每组最大的标志值。如果各组的组限都齐全,称为闭口组;组限不齐全,即最小组缺下限或最大组缺上限,称为开口组。

(1)划分连续型变量组限时,采用“重叠分组”和“上限不在内”原则,每组变量值都以下限为起点,上限为极限,但不包括上限。

(2)划分离散型变量组限时,相邻组的上下限应当间断,但在实际中为求简便也可采用“重叠分组”。此外,当变量出现极大值或极小值时,可采用开口组,即用××以下或××以上表示。

2.组距。每组下限与上限之间的距离称为组距。即

组距上限-下限

组距式变量数列,有等距和不等距两种。等距变量数列,是指各组的组距都相等。适用于现象变动比较均匀的情况,如收入水平分组、单位面积农产品产量分组等。但在现象变动不均匀或是为了特定的研究目的时,常常采用不等距分组,编制不等距变量数列,如人口的年龄分组常采用不等距分组。不等距变量数列中,可以用次数密度来反映各组实际次数的分布情况。

3.组中值。每组下限与上限之间的中点数值称为组中值。

组中值

开口组的组中值计算公式为

缺下限组的组中值该组上限-

缺上限组的组中值该组下限+

组距式分组掩盖了各组标志值的分布情况,为了反映各组标志值的一般水平,通常用组中值作为各组的代表值。利用组中值的前提是:假定各组变量值的分布是均匀的或对称的。但在实际工作中大多数资料并非如此,因此,组中值作为各组的代表值只是一个近似值。

二、变量数列的编制

(一)单项式变量数列的编制

【例3】某生产车间50名工人日加工零件数(单位:个)如下:

试编制单项式变量数列。

首先,将总体各单位标志值由小到大排列:

其次,以总体各单位标志值为各组标志值,以总体各单位标志值出现的次数为各组次数,编制单项式变量数列。

通过所给资料我们编制了单项式变量数列,但却很难看出50名工人日加工零件数的分布特点。因为该资料中,变量值不但多达27个,而且变量值107~139的变动范围也比较大,即使能一一列举,也不适宜编制单项式变量数列。如果编制成组距式变量数列,又会是什么结果呢?

(二)组距式变量数列的编制

【例4】应用【例3】资料数据,试编制组距式变量数列,并计算频数、频率和组中值。

第一步,计算全距。

将总体各单位标志值由小到大排列,找出最大标志值与最小标志值,二者之差就是全距。上例中全距139-10732(件)。

第二步,确定组数和组距。

在同一变量数列中,组数与组距相互制约,组距大,组数就少;组距小,组数就多。组数与组距的确定,应力求符合现象的实际情况,充分体现总体分布的特征。二者谁先被确定,应视具体情况全面考虑。如果先确定组距,除考虑上述要求外,还要充分考虑原始资料分配的集中程度或集中趋势,以及组内的同质性、组间的差异性。一般来讲,组数确定为5~7为宜。

上例中,组距为5件,相应的组数为7组。

第三步,确定组限。

确定组限要考虑以下几点:

1.最小组的下限(起点值)可以略低于最小变量值,最大组的上限(终点值)可以略高于最大变量值;

2.如果组距是5,10……,100,则每组的下限最好是它的倍数;

3.组限的具体表示方法,应视变量的性质而定。

第四步,计算各组频数、频率和组中值。

从组距式变量数列中可以看出,50名工人日加工零件数主要集中在115~129件,占64%。在某一变量数列中标志值构成的数列表示标志值的变动幅度,而频数构成的数列则表示相应标志值的作用程度。频数愈大则相应组的标志值对全体标志水平所起的作用也愈大;反之,则相应组的标志值所起的作用愈小。因此,在整理和分析的时候,我们不但要注意各组标志值的变动范围,而且,也要注意各组标志值的作用大小,即频数的大小。将各组单位数和总体单位数相比,既可以表明各组标志值出现的频率的大小,也可以表明各组标志值对总体的相对作用程度。

按顺序列出各组标志值的范围(或以各组组中值来代表)和相应的频率形成的次数分布,又称统计分布。任何一个统计分布都必然满足:各组的频率大于0,各组的频率总和等于1(或100%)。

统计分布是统计描述的一种重要方法,在自然界和社会现象中,有许多统计分布是属于正态分布的。例如,人的体重、身高、单位土地面积的农产品产量等,这类分布以标志变量的平均值为中心,沿着对称轴向两边发展,愈接近中心,分配的频率愈高,愈远离中心,分配的频率愈低,形成“两头小,中间大”的分布曲线。

还有一种社会现象的分布和正态分布相反,是沿“两头大,中间小”的形式发展,呈“U”字形分布。如人口的死亡率,按年龄分布如下:0~4岁,特别是未满1岁的婴儿,死亡率最高,从5岁起死亡率逐渐下降,至10~14岁时,达到最低水平,从15岁起又缓慢上升,50岁以后上升显著增快,到60岁以后又达到最高水平。

(三)累计频数和累计频率的计算

在研究次数分布的时候,我们常常还需要编制累计频数数列和累计频率数列。其方法通常是首先列出各组的组限,然后依次累计计算到本组为止的各组频数,求得累计频数。将累计频数除以频数总和即为累计频率。

【例5】以【例4】资料为例,试计算累计频数与累计频率,计算结果见。

累计频数和累计频率的意义是很明显的。“向上累计”栏是将各组频数和频率从变量值低的组向变量值高的组累计,故称为向上累计,各组累计数的意义是各组上限以下的累计频数或累计频率。当我们所关心的是标志值比较低的现象的次数分布情况时,通常采用向上累计,以表明在这些数值以下的所有数值所占的比重。例如,日加工零件数在109件以下的有3人,占总数的6%;第二组资料说明日加工零件数在114件以下的有8人,占总数的16%。有时为表示在一定标志值以上的累计频数和累计频率,则要从变量值高的组向变量值低的组累计,来求得累计频数和累计频率,称为向下累计“向下累计”栏,各组累计数的意义是各组下限以上的累计频数或累计频率。当我们所关心的是标志值比较高的现象的次数分布情况时,通常采用向下累计,以表明在这些数值以上的所有数值所占的比重。例如,日加工零件数在125件以上的有20人,占总数的40%,第三组资料表示日加工零件数在115件以上的有42人,占总数的84%。

由此可见,累计频数和累计频率可以更简便地概括总体各单位的分布特征。

同类推荐
  • 创新型人才素质教育

    创新型人才素质教育

    当今世界是一个多层次生产力的发展局面。由于生产力发展水平的差异,国家与国家之间、地区与地区之间在经济和文化领域形成了巨大的差距。而这种差距首先是开发创新能力的差距,也就是创新的差距。创新,是一个国家、一个民族屹立于世界之林的最有力的“武器”。历史证明,创新是一个民族进步的灵魂,是一个国家兴旺发达的不竭动力。
  • 指导学生心理健康的经典故事:透析花季奇妙感情

    指导学生心理健康的经典故事:透析花季奇妙感情

    每个人都在梦想着成功,但每个人心中的成功都不一样,是鲜花和掌声,是众人羡慕的眼神,还是存折上不断累积的财富?其实,无论是哪一种成功,真正需要的都是一种健康的心理。有了健康的心理才是成功的前提与保证,在人的一生中,中学是极其重要的一个阶段,心理健康对以后的健康成长非常重要。
  • 备课,磨刀不误砍柴工

    备课,磨刀不误砍柴工

    本书在指导教师备课的自主教学理念下,介绍教师备课的技巧与方法,鼓励自主研究,提高能力。是一本为充分提高教师的教学水平的参考图书。
  • 汤姆·索亚历险记

    汤姆·索亚历险记

    《汤姆·索亚历险记》讲述的是一个淘气叛逆的小男孩汤姆·索亚的故事。汤姆做过很多反叛的事情,逃课、撒谎、贪玩。各种“坏孩子”的特征在他身上展露无疑,但他其实非常明白应该如何做一个“乖孩子”。只是,一切允许被做的事情,他都觉得毫无魅力可言。所以,在那个习俗虚伪庸俗、学校教育刻板陈腐的时代下,汤姆更加反叛和顽劣。他抗拒履行社会习俗、参加学校教育,他十分渴望自由,甚至梦想去做“强盗”以求摆脱约束。汤姆在顽劣的表象下,有一颗热血、正义的心,这正是他闪闪发光的地方。每一个孩子的内心都要坚定地保持心中认为正确的事情,有善念,行善事,在未来就能丰收无限的美好可能。
  • 大卫·科波菲尔(新课标同步课外阅读)

    大卫·科波菲尔(新课标同步课外阅读)

    大卫·科波菲尔早年丧父,因为母亲的性格比较柔弱,童年时他受尽继父的折磨和虐待。在母亲病逝后,他不得不投身社会,开始工作。在许多善良人们的帮助下,最终他克服了种种困难,在事业和生活上得到一个完满的结局,成为一位名作家。本书译本选用著名翻译家宋兆霖的译本,让青少年在感受经典的同时,还可近距离地接触大师,汲取人生智慧,并提高青少年的写作能力。
热门推荐
  • 天不亡秀

    天不亡秀

    女主秀短暂而又悲苦的一生,有奋斗,有努力,但命运总是让她陷入痛苦,她却善良的活着,尽自己当母亲,当妻子的责任。
  • 重生之末世帝王

    重生之末世帝王

    重生的末世的帝王,少云,谁与争锋!作者我知道末世这类小说现在火的厉害,写多好也没有那些大神写得好,但我不放弃……
  • 傅先生可真是一只狡猾的狐狸

    傅先生可真是一只狡猾的狐狸

    小奶茶,你己入我瓶中,怎能放你离去!傅逸看着红着脸的女人甚是满意,兴味的挑起她右侧的发丝撇向耳后,慢慢的俯下身去。“夫人喜欢看的话,那便回家了,继续看,细细看。”傅逸戏谑的声音突然传来。
  • 深渊之祖的打工生涯

    深渊之祖的打工生涯

    身份成谜的大佬,带着失忆的充电宝穿梭万界,最终重构海清河晏,只是……“王爷,你什么时候杀了我?”“马上。”“医生,你什么时候动手术?”“立刻。”“将军,你什么时候给我名分?”“现在。”“队长,你什么时候能记起我?”“你说呢?”……我姓为白,只想奉你为王;我姓为御,惟愿予你时光。【相信我,真的是个小甜饼……】
  • 国民厨神好会撩

    国民厨神好会撩

    撩值我有,天下美食尽出我手!叮,撩值+250!叮,撩值+1000……撩到水煮鱼!撩到宫爆鸡丁……撩到鲁菜大成,撩到川菜大成,撩到粤菜大成……撩到八大菜系大成!左撩右撩,上撩下撩,单撩群撩,普撩爆撩……且看任天一撩出姿势,撩出水平,撩成一代国民厨神!
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!
  • 护花御医

    护花御医

    医武双绝的少年,出山入世磨炼心性,率性而为的他,又会在都市掀起什么样的风云?妩媚妖娆的极品老板娘,清纯可人的小警花,小家碧玉般矜持美女老师……众多美女纷纷投怀,他是花丛老手?还是新丁?
  • 八荒古帝

    八荒古帝

    人们知有混沌世界孕育大能用武器开辟混沌身躯演化万物自成一方世界,可是混沌是怎么来的他手里的武器是怎么来的呢?山村中一个普通的少年凭借我若存道可无的魔念破苍穹踏不朽走上了一条探究混沌演化世界之奥的逆天之路。
  • 王者荣耀之终极挑战

    王者荣耀之终极挑战

    是李白豪迈的“十步杀一人,千里不留行”,还是他的小迷弟曜的“所有的星星眼,都在等一颗星?”阅读此小说,你就会知道答案!!!
  • 潜俘娇萌小胖妻

    潜俘娇萌小胖妻

    傅圆圆,人如其名,一个呆萌可爱的胖子,心安理德的过着混吃等毕业的大学生活。突然有一天,青梅竹马的男神向他表白,又有海归总裁如狼似虎扑了上来,这是什么情况?小胖妹的青天到了吗?圆圆不要怕,勇敢向前冲!