登陆注册
42842900000053

第53章 统计分析(4)

例如,教育水平低的有30人(这是边缘次数),其中以快乐家庭、理想工作和增长见闻为最大志愿的分别有5人、20人和5人(这些是条件次数),由此可见,这些青年中大多数是以理想工作为最大志愿。同理,可知其他教育水平的志愿分布情况。

条件次数表有大小之分。计算的方法,通常是将依变量值的数目乘上自变量值的数目。如果我们将依变量放于表的旁边,将自变量放于表的上端,则表的大小就是横行数目(rows,简写)乘上纵列数目(columns,简写犮),即表的大小=×犮。这个先后次序的用意,是表示前者(依变量)是受后者(自变量)影响的。上表有3个横行和3个纵列,所以表的大小=3×3。如果教育水平由三级变为两级,但志愿的分类不变,则表的大小=3×2。如果教育水平仍是分三级,但志愿的分类变为2种,则表的大小=2×3。要注意的是,3×2表不同于2×3表,因为不同位置的数值代表不同的变量。

条件次数表的缺点是难于比较不同条件下的次数分布,这是因为作为基数的边缘次数各有不同。例如上表,中等教育水平的青年中有30人的志愿是理想工作,低等教育水平的则有20人,前者多于后者,是否表示前者较多以理想工作为最大志愿呢?由于表的下端显示前者的基数(即边缘次数)是60人,而后者是30人,也是前者多于后者,我们不易下结论。因此,为求相互比较从而知道两个变量间的关系,就必须将各个基数标准化。换言之,要在相同的基础上作比较。

最常用的标准化方法,是将所有基数都变成100,各个条件次数就随而变为百分率。这样制成的表,就称为条件百分表。例如下表103,就是根据上表而制成的条件百分表。

将此表103的各列条件百分率相互比较,就可以知道教育水平对志愿的影响。例如,将各列条件百分率对比,可见低等教育水平的青年比其他教育水平的青年更以工作为重。又高等教育与中等教育水平的青年都重视家庭情况,但前者比后者更重视见闻,而后者则比前者更重视工作情况。总括来说,如果青年人的教育水平不同,他们的最大志愿也会有区别。教育是决定青年人志愿的因素之一。

在制定条件百分表时,最好能依据下列的准则:

(1)每个表的顶端要有表号和标题。加上表号,可以方便讨论和减少混乱。

简明的标题,能使读者容易领会表内数值的意义。

(2)绘表时所用的线条,要尽可能简洁。舍去不必要的线条,可以节省绘制的功夫,也会令人看起来舒服。上表所用的线条就是力求简洁,是当今的社会学刊物中常用的一种方式。

(3)在表的上层(即自变量的每个值之下)写上%符号,表示下列的数值都是百分率。如果表内每个数值都附有%符号,就太繁复了。

(4)表下端括弧内的数值,表示在计算百分率时所根据的个案总数。写出这些数值,固然可以使我们知道各列百分率的基础,同时也使我们可以随时将百分率数值变回原来的次数值。如上表左上角的数值50.0%是根据10名个案计算出来的,原来的条件次数便是5(=10×50%)。因此,在研究报告中,如果有条件百分表,便不需要有条件次数表。

(5)表内百分率数值的小数位要保留多少,视研究的需要而定,但最好是有一致性。例如,上表既然用上16.7与66.7,就要用50.0与0.0,而不是50或0。

要注意的是,这些小数点后的0是一个有意义的数值,表示全部百分率的计算都是以保留一位小数作准则。

三、消减误差比例

相关测量法,就是以一个统计值表示变量与变量之间的关系。这个值,通常称为相关系数。

相关测量法有许多种,大多数是以0表示两个变量间没有关系,以1表示全相关,因此介于0与1之间的系数值越大就表示相关程度越高。如果是定距或定序变量,更可以测定相关的方向,通常是以“+”符号表示正相关,以“-”符号表示负相关。

相关测量法既然有许多种,我们怎样选择呢?首先,要注意变量的测量层次:定类、定序和定距。属于不同测量层次的变量,就要用不同的相关测量法。

其次,就是看统计值的意义。我们最好选用统计值有意义的相关测量法。在统计学中有一组相关测量法,其统计值具有消减误差比例(proportionatereductioninerror)的意义,称为PRE测量法。

什么是消减误差比例呢?社会研究的主要目标是预测或解释社会现象的变化。比如有一种社会现象Y,我们就要预测或理解其变化的情况。预测或解释时,难免会有误差(即错误)。假定另一种社会现象X是与Y有关系的,如果我们根据X的值来预测Y的值(例如据每个青年人的教育水平来估计其最大志愿),理应可以减少若干误差。而且,X与Y的关系越强,所能减少的预测误差就会越多。换言之,所消减的误差有多少,可以反映X与Y的相关强弱程度。

现在假定不知道X的值,我们在预测Y值时所产生的全部误差是1。如果知道X的值,我们可以根据X的每个值来预测Y值;假定误差的总数是2,则以X值来预测Y值时所减少的误差就是:1-2。这个数值(1-2)与原来的全部误差(1)相比,就是消减误差比例。

例:X→Y用X去预测Y现象。

不知X,预测Y全部误差,可用〇Y表示。

知X,预测Y,假如X、Y有关系,则可消减(减少误差)X。

可用下面的公式表示:

PRE=(1-2)/1。PRE的数值越大,就表示以X值预测Y值时能够减少的误差所占的比例越大;也就是说,X与Y的关系越强。

从上面的公式中,可见PRE数值应在0与1之间。如果2=0,即以X预测Y不会产生任何误差,则PRE=1,反映X与Y是全相关。如果2=1,即以X预测Y所产生的误差相等于不以X来预测Y所产生的误差,则PRE=0,反映X与Y是无相关。又比如PRE数值是0.80,就表示以X预测Y可以减少80%的误差,反映两者的相关程度颇高。但是,如果PRE数值是0.08,就表示只能消减8%的误差,即X对Y的影响甚小,我们需要寻求其他的变量来预测或解释Y。

从上面的讨论中,可见PRE测量法的统计值所具有的意义合乎社会研究的需求,故常用于社会研究中。社会研究要求预测或解释社会现象的变化,但会有误差。社会研究所以要研究现象与现象之间的关系,目的就是要减少预测或解释时的误差,减少得越多,就显示我们的预测或解释能力越强。而PRE数值的意义,就是表示用一个现象(如变量X)来解释另一个现象(如变量Y)时能够减除百分之几的误差。

然而,PRE测量法有很多种,我们在分析两个变量之间的关系时应该如何抉择呢?首要的准则,是两个变量的测量层次。次要的准则,是两变量之间的对称或不对称关系。我们必须尽可能遵守测量层次这项准则;至于关系是否对称这项准则,当然最好是遵守,但不用过分重视①。

社会学研究所经常关心的是三项测量层次:定类、定序和定距。研究两个变量的关系时,可能产生下面的六种情况:

①两个定类变量;

②两个定序变量;

③两个定距变量;

④一个定类变量和一个定距变量;

⑤一个定类变量和一个定序变量;

⑥一个定序变量和一个定距变量。

四、相关测量法

1.λ测量法

λ用在寻求社会变量的定类和定类变量层次之间或定类与定序变量之间的相互关系测量上。

这个例子中PRE(消减误差比例)的意义如何呢?

(1)如果不知r(性别)的资料,只用(电影爱好)的资料,即只知道100人中有34人喜欢侦探片,57人喜爱言情片,而不知其男女性别分布情况。那么,我们用众值57来预测每一个个案,其错误率就是1=43。

(2)已知r的分布,来预测每个个案,即在男性中,我们以众值35来代表50人全体,其错误为15;在女性中,我们以众值42来代表50人全体,其错误为8。

结论:消减误差比例为0.46,也即以性别来预测电影爱好能减少46%的误差。

2.aMMa测量法对于定序-定序的变量,往往用Gamma测量法。

先介绍一下Gamma测量法中特定的符号含义。

下图图示显示ABCDE五人在X与Y两变量上的名次。然而两者是否相关呢?即是否在X上名次高,在Y上也名次高呢?对于这两个定序变量,往往用Gamma系数(犌)来表示其相关程度。从而每个个案以比较高低。这里常用以下几个概念:

同序对:一对对象在两个变量的排列次序上是一致的,称之同序对。如上表中AB是同序对,A在X、Y这两个变量上的名次都高于B(3大于2,2大于1)即在排列次序上是相同的。

异序对:一对对象在两个变量的排列次序上不一致时,称之为异序对。如在上表中,BC是异序对。B在X变量上小于(低于)C,(2<3)而在变量上大于(高于)C(1>0)。在次序排列上是不一致的。

X同分对:一对对象在r的变量方向上是一致的,在的变量中不同。上表中AC是同分对。

Y同分对:一对对象在的变量方向上是一样的,即相同的。上例中BD是同分对。

XY同时分对:一对对象在r和的变量方向上都要一致的,上表中DB是r、同分对。

这样的对子,写几本练习本都写不下。

为此我们需探求其中是否有些规律性的东西。

一般的情况下,我们可以将原始资料通过以上分类,列成条件次数表,然后以如下的规则求同序和异序对:

下面举个例子来巩固一下Gamma测量法。

如有一个调查是关于父母的文化水平与幼儿认知水平的关系(如下表)。

父母的平均文化水平与儿童的认知发展水平这是两个定序变量。

这两者是否有关系,要看其相关的程度如何。我们可以用Gamma测量法。

这说明父母的平均文化水平与儿童的认知发展水平两者是相关的,是连同发生的,相关程度是0.53,即以父母的文化水平来预测儿童的认知水平可减少53%的误差。但是,父母的文化水平是否为儿童的认知发展的原因还未能说明,还要作进一步的分析。

3.测量法

(1)相关系数

相关系数用表示,是两列变量间相关程度的数字表现形式。

求的条件是:变量是定距-定距,定比-定比,定比-定距。Σ(X,Y)是线性的,非方向性的。

当我们选择容量为n的随机样本,并对样本的每一个个体作两方面观察以后,我们就得到n对观测资料。

例如,现代学校一般保持着每一个学生的身体、心理、教育各方面特征的记录。这些记录可能是年龄、身高、体重、各科成绩、智力、兴趣或其他性格等。如果我们把标志着每一学生的任何两个特征的数量一对一对地抽出来,便得到几对观测资料。如我们取每人的身高和体重,也可取语文成绩和数学成绩成对进行考察。同样,我们对于小麦块的样本,可以测度每一地块的产量及其降雨毫米数。或者,对于老鼠的样本,可以测度每只老鼠自上次喂食以来的时间及其通过另一端放有食物的迷宫的时间。

所有这些情况均有某些共同点——随机样本的每一个体均有两种可以测度的有意义的属性。我们用X表示第一种属性的测度值,用Y表示第二种属性的测度值。那么,第一个个体的观测资料是(X1,Y1),第二个的观测资料是(X2,Y2)等,从而随机样本由n对观测资料(X1,Y1),(X2,Y2)……(Xn,Yn)组成。

(2)相关系数的计算

我们知道表现相关程度的数字,称为相关系数(CorrelationCoefficient)。

而这个数字应有个计算公式,以便应用。20世纪初,英国的统计学家皮尔逊(KarlPearson)创立了计算相关系数的公式,因而称之为Pearson系数。

这是定义公式。在计算时较为繁杂。在实用上,为求简便,我们有一个计算公式:

当未归类的原数目量不太大时,可直接用原数目求相关系数,这是此公式的好处。在标准台式计算器上,一次连续运算中获得如下5个总数往往是可能的,即——ΣX,ΣY,ΣX2,ΣY2,ΣXY。故而也便于借助电子计算机来运算。

例如,假定从某城市40-50岁全工作日就业总体中抽选一随机样本,并记载每人的受教育年限(X)和以10元为单位的日收入(Y)。而且假定12个人的随机样本有下列资料。

我们以下表数据用计算公式来计算样本相关系数。

以上列表求出5个总数。我们使用CASIOJr-120或CASIOJr-140计算器,可分别将X及Y的原始数据输入,直接在机器的表度盘上显示出ΣX2,ΣX,n,X,σn,σn-1等数值,取其中ΣX2,ΣX,ΣY,ΣY2,然后再求出ΣXY即可。

以上计算也可用假定平均数进行计算。

从上例运算可知,即使原数目很小,运算起来也是数目越算越大,十分麻烦。

如果我们用在原数中每个数都减去一个假定平均数的办法,可以使数目化小,方便计算。这个假定平均数不必是真实平均数,只需估计一下即可。其计算公式为:

同类推荐
  • 校长决策第一推动力丛书-校长的影响力

    校长决策第一推动力丛书-校长的影响力

    校长要从事的具体工作很多,但不论对哪一项工诈,校长的角色决定着校长更多的是从事各项工作的决策。校长决策属于校长管理的范畴,而校长决策水平则直接体现校长的管理水平,直接左右学校的前途与命运。由此可见,校长决策的重要性。特别是随着社会的进步与发展,随着学校教育环境的复杂化,校长决策尤其是校长的科学决策就显得极为重要。校长科学的、正确的决策能保证学校克服困难,勇往直前,走向胜利;错误的决策会让学校蒙遭损失、停滞不前乃至失败。
  • 中外地理故事

    中外地理故事

    本书呈现在你眼前,会让你大开眼界,让你学到更多的地理知识。它不仅生动而翔实地讲述了上面提到的地理奇观,同时还能让你了解一些你从未听过的地理奇闻或找到长久以来困惑你的答案。相信通过对这些知识的了解,你会对自己身处的这个世界有更深的认识,并且对基于地理基础上的人类历史和文明有一个全新的认识。
  • 中国逻辑与语言函授大学教材——管理学

    中国逻辑与语言函授大学教材——管理学

    本书力求做到系统性、完整性、实用性、简明性,清晰明了地说明管理问题。为了更好地学习本书知识,每章后边都配有案例及习题,以便于深入学习、理解和掌握相关知识。本书由张仁侠教授担任主编,宋克勤、肖霞、王敬、阎甜参加编写。
  • 新课标英语学习资源库-小红帽

    新课标英语学习资源库-小红帽

    课标是常新的,经典却是永恒的,走进经典的选择,学习兴趣的提高离你只有一步之遥。本套丛书包括奥林匹斯山众神、白雪公主、百万英镑、包打听、财神与爱神、打火匣、带家具出租的房子、公主与美洲狮、好孩子的故事、荷马墓上的一朵玫瑰、黄缘奇遇、灰姑娘、井边的牧鹅女、警察与赞美诗、两个勇敢的伊洛特人、母亲的故事、牧羊女和扫烟囱的人、女巫的面包、青蛙王子、三万元遗产、沙丘的故事、忒修斯历险记、特洛伊战争、天国花园、小爱达的花、小红帽、幸福的家庭、雪人、一本不说话的书、勇敢的小裁缝。
  • 学校行为文化的建设管理(上)

    学校行为文化的建设管理(上)

    文化的内涵非常丰富,其本义则是“以文教化”,表示对人的性情的陶冶,品德的教养,属于精神领域的范畴。所以,我们学习文化知识,就是为了不断提高个人的文化素质修养。
热门推荐
  • 实名已心动

    实名已心动

    【暴躁节能主义大佬VS乖巧佛系神经女孩双向暗恋的青春校园故事】人与人之间的缘分就好像在某个特定的时间点突然间打开了阀门,躲也躲不了,逃也逃不掉。大灰狼会收起他的獠牙,小白兔也会伸出她的小爪,他会对她好,好到任何人都无法打扰。“林冉!你看什么呢?”“帅哥。”少年脸一黑,站在女孩面前,弯下腰,凑到她耳边低低的说道:“是爷不够帅,还是你眼瞎,只要你答应做我的女朋友,爷可不介意天天给你看。”“......”16岁的林冉和17岁的祁轩在那个夏天邂逅,那是青春送给彼此最好的礼物。“我陪你长大,你跟我回家。”“拉钩。”“拉钩。”
  • 绝代修真

    绝代修真

    当他是女的,他倾倒苍生,当他是男的,他绝倒天下!高中生冷秋夜因为一颗蓝灵珠而变成一绝色女子,只有一个月十五那天可以变回去,可是变回去的却是……
  • 夜落叶起

    夜落叶起

    一场突如其来的灾难毁掉了武道废柴叶枫的平凡人生,绝处逢生的他走上修真之路。500年闭关,却迎来了悲惨的结局。万念俱灰之下,在一股神秘力量的牵引下,叶枫的残破元神回到了500多年前的地缘星。而这次归来的叶枫,脑中总是偶尔会闪现一些神秘记忆碎片。那些究竟是什么,叶枫总有些熟悉又陌生的矛盾感……
  • 英雄联盟之末世系统

    英雄联盟之末世系统

    靠,末世爆发了。等等主角为什么没有异能,不可以操控丧尸,英雄联盟系统。好吧,上天对我还可以,看看给我什么东西。滴,联盟币不足。好吧我去干丧尸,从逍遥一时到常人,受尽欺凌,终有一日觉醒,末世单单只有怎么简单吗,死亡之战,但人类的自身欲望也完全放了开来,‘’死亡,只是新的开始,但现实十分残酷,力量,每一个人都渴望力量,生命,食物,武器。‘’
  • 女魔头今天一统江湖了吗

    女魔头今天一统江湖了吗

    闻玉死的时候身边只有一条狗,和她一样瘦得皮包骨头,奄奄一息。十三年前,料谁也想不到堂堂天剑城女魔头会落得这样一个下场,那时她意气风发,杀人如麻,长剑在手轻轻一挑便能取人性命。如今却被困在这阴沟里等死,死后甚至没有一具全尸。身为一个女魔头,闻玉早知道自己不会有好下场,只不过没想到她的下场是不仅被骗了命,还被骗了感情。那个骗她的人带了三百多人围剿她,最后挑断她的四肢,将她扔到了山崖底下。
  • 大雪无乡

    大雪无乡

    本书为“三驾马车”丛书之一,收录了作者近年来创作的中篇小说代表作8部。作者的“谓莲湾风情”系列,独树一帜,将发生顏莲湾的种神故事,那种新与旧,传统与现实的撺沿和矛盾,以独持的视角繁衍成篇,令人对这一方迷人的水产生眷恋和向往。此外,作者也走出大海,将笔触伸向上袤的农村田野和处境艰难,自强不息的工业企业,将作者的体验和困惑,将社会转型期不可避免的阵痛展现出来,让读者尽情感受新生活的气息。
  • 混沌兵道

    混沌兵道

    大陆从未出现的先天五属性兵力的少年,“兵醒”结束后,却只得一把铁级神兵,无法附加更多的属性于神兵上。是天才的损落?还是废材的极致升华?且看一人一刀,如何划破苍穹,斩尽世间不公。
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!
  • 越爱越晓心

    越爱越晓心

    物理系美女苏晓外表贤良淑德,内在腹黑女汉子,身边好友个个花痴。就连捡来的狗狗也好色无比!哥哥为了她学了法律,考了律师,就怕她失手把人打死。大师兄妹控,小师弟姐控,一帮师兄弟个个围着转。大神挥挥手,三次牵上手。苏晓:如果有下次,我一定争取坚持到第四次。爱情不知不觉中降临,越爱就要越晓心。
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!