登陆注册
42842900000055

第55章 统计分析(6)

复相关(multiplecorrelation)是以一个统计值简化多个自变量(X1,X2……Xa)与一个依变量(Y)的关系的统计方法,可表示为:

复相关是以积距相关为基础,统计值的值域是(0,1),只表示相关的强弱,不表示相关的方向,因为各自变量对依变量的影响的方向可能是不同的,不可能求得共同的影响方向。相关的平方值2称为决定系数(coefficientofdetermination),具有消减误差比例的意义。1-2是剩余误差,通常称为疏离系数(coefficientofalienation)。

为了形象地表达复相关系数的基本逻辑,我们用下面的三环图表示两个自变量X1和X2与Y的相关:

在左图中三个圆分别代表Y、X1和X2,整个圆代表当不知X1和X2时,仅用Y本身的平均值预测每个个案的Y值时全部的误差。当我们用X1来预测Y时,所消减的误差比例是21,即斜线阴影部分。当我们再引进X2来预测Y时,由于X2消减的误差中有一部分,即一个圆相交的斜线阴影部分已被X1所消减。

因此,要控制X1的影响才求得引进X2后能增加多少被消减的误差,用部分净相关可求得此结果,此结果以2(2,1)代表。在图中便是麻点阴影部分。因此X1和X2共同消减的误差是:

用于计算复相关的数据资料原则上必须满足两个前提条件:第一是各自变量与依变量的关系在分布上呈直线;第二是严格而言,复相关以下将要介绍的多元回归、因径分析和因素分析的每个项目或变量都应该是定距或以上测量层次,但是社会学研究中定距变量毕竟是少数,大量的变量都是定类或定序的。对于定序变量,如果希望采取复相关,多元回归等较为深入的统计方法。可以将之变为虚构变量。但是,这样做颇为麻烦。因此,一些社会学研究者宁愿将定序变量当作定距变量来分析(李沛良,1987)。尤其是当变量是由多个定序的项目相加而成时,等级增多了,比单个项目的定序较为接近定距变量。将定序变量当作定距变量分析在一定程度上有损与统计的精确性,但是为了能使用较为细致、深入的统计方法。这样做有时还是可取的。

三、多元回归分析

复相关测量两个以上的自变量与一个依变量的总相关。但是不能以各个个案的两个以上的自变量估计或预测一个依变的数值,同时也无法比较哪个自变量对依变量的影响力较强。在介绍了如何运用简单直线回归分析以一个自变量预测一个依变的数值。以简单直线回归为基础发展的多因直线回归分析(multiplelinearregressionanalysis)则可以解决上述复相关不能解决的两个问题,多因直线回归分析可表示为;我们曾介绍简单直线回归方程:

简单直线回归方程经标准化后成为直线回归方程:

相应的,分析多个自变量对一个依变量的影响的多因直线回归方程多是:

an表示n个自变量的回归方程式的截距,b是净回归系数,反映控制其他变量后,某个X变量对Y的影响力,与简单直线回归一样,多元直线回归方程式也是根据最小平方准则建立的。可以根据若干个自变量X值估计或预测依变量Y值。但是由于各自变量的单位不同。各b值的值域不固定,无法根据其大小比较各个自变量X对Y的影响力。如果要作比较,必须标准化将每个个案自变量和依变量的数值都转为标准值。用标准值建立标准多元直线回归方程式经过标准化,各X值和Y值的平均值都等于零,因此标准多元直线回归方程中的截距α等于零,方程中的β是标准净回归系数。其值域是[-1,1],可反映X对Y的影响力和方向,比较各β便可知道X对Y的相对影响力。

那么如何计算多元直线回归方程呢?

首先介绍两个自变量的分析,其模型是:

当只有两个自变量X1、X2时,求β1、β2的公式推导已经介绍过,当在3个自变量X1、X2、X3时,β1、β2、β3推导的道理是相同的。

因为:1=Σβnni

所以,当有3个自变量X1、X2、X3时;由于自身的相关低于1,并且截距相关是对称的,12=21,因此上述方程组可简化为:

1=β1+β221+β331

2=β112+β2+β332

3=β113+β223+β3

其实根据上面的这组公式,只要求得由4个变量组合的相关,不必像前面介绍的两自变量的β计算时作β的公式整理推导,直接将各相关系数代入上面的方程组,便可解出β1、β2和β3,根据β和b的关系,又可求得b1、b2和b3的值:

求得b1、b2和b3,便可计算截距:

a3=Y-b1X1-b2X2-b3X3

多元直线回归必须注意下列三个问题:

第一,直线关系。多元直线回归要各自变量与依变量的关系是直线的,如果发现资料中自变量与依变量的关系显曲线状态,解决的办法有两个:一是将变量转换为对数,倒数或方根等;二是采用多项式回归分析(polynominalregressionanalysis)。

第二,统计累赘。如果要比较3个以上的自变量对依变量的相对影响力,即比较β1、β2和β3的大小时,必须注意统计累赘(statisticalredundancy)的问题,β代表控制其他变量后其相应的自变量对依变量的相对影响力。例如β1=βY(1.23)代表控制了X1和X3后X2对Y的影响力。如果其中的两个自变量,如X1和X2之间的关系特别强在互相控制后会使各自的影响β1和β2显得微弱,而其他变量,X3的影响β3便会显得比β1和β2强。但是,可能实际上X1和X2对Y的影响力比X3大,这便是统计累赘的问题。为了避免统计累赘的问题,在选择自变量时不要引进互相之间相关强的变量。同时也不要随便引进不很重要的自变量。

第三,统计互动。统计互动(statisticalinteraction)是指两个或两个以上的自变量共处时可能会产生一种不同于它们各自的效果之和的互动效果①。

第六节推论统计简介

一、推论统计一般概念

推论统计是一门通过样本的统计值来估计总体的参数值的学问。在社会研究中,我们很少做普查,更多的是做抽样调查,所描述分析的资料也多为样本资料。

对样本资料的分析是叙述统计,如前所述,集中趋势、离散程度、相关分析、回归分析等。然而,抽样调查的目的是要由样本特征对总体作出结论,这就是推论统计。

推论统计分为两大类:(1)参数估计(parameterestimation);(2)假设检验(hypothesistesting)。所谓参数的估计,就是根据一个随机样本的统计值来估计总体之参数值是多少。例如,由样本算出的每月收入平均值680元,则在总体中平均是多少呢?可见参数之估计这类统计推论方法,是先看样本情况,才问总体的情况。至于假设之检验,在逻辑上与参数之估计有点不同;它是首先假设总体的情况是怎样的,然后以一个随机样本的统计值来检验这个假设是否正确。

换言之,要先构思总体的情况,才进行抽样和分析样本的资料。例如,我们先假设总体的情况,才进行抽样和分析样本的资料。例如,我们先假设总体的均值是750元,然后根据样本的均值来发问:原先的想法(即假设)对吗?由此可见,参数估计与假设检验,虽然都是用来作推论统计,但在逻辑上略有不同;前者是先看样本情况才问及总体的情况,后者则先构思总体的情况,然后才进行抽样和分析样本的资料。

二、参数估计

1.点值估计与间距估计

以样本的统计值来估计总体的参数值有两大类做法:一类是点值估计;另一类是间距估计。两者皆要求样本是以随机方法抽取的。

同类推荐
  • 大学生职业发展实用教程

    大学生职业发展实用教程

    《大学生职业发展实用教程》结合当前大学生就业形势,贯彻党的十八大关于促进大学生更高质量就业的精神,以培养大学生树立正确的择业观、提高大学生就业能力为目的,结合高校开设大学生职业发展与就业指导课程的实际情况,精心组织,周密安排。由长期从事大学生就业教育的教师们结合自身多年教学改革的成果编写而成。全书共设五编十章。分别从就业形势、职业规划、职业素质提升、求职应聘实务、创业入门等五个维度,针对大学生就业创业过程中面临的一系列问题,深刻地分析了大学生面临的就业形势,全面地介绍了职业的基本知识、职业规划的基本方法、提升职业素质的途径、求职应聘的技巧,以及创业入门的基础知识。
  • 海上鏖战

    海上鏖战

    本书介绍了马塔潘角战役、北极航线战役、马来西亚海战、莱特湾战役、北角大海战、瓜岛海空战等第二次世界大战中的著名战役。
  • 郁达夫精品集

    郁达夫精品集

    郁达夫是20世纪20年代中国现代文学中仅次于鲁迅的最重要小说家之一。郁达夫自称自己身上有三重精神要素:对大自然的迷恋,向空远的渴望,远游之情。反映到他的作品中,善于写风景、回归大自然是郁达夫的特色。本书选编了郁达夫的大部分作品,基本可以反映作者的思想、才华和艺术取向。
  • 语文新课标课外必读·第三辑:小公子

    语文新课标课外必读·第三辑:小公子

    国家教育部颁布了最新《语文课程标准》,统称新课标,对中、小学语文教学指定了阅读书目,对阅读的数量、内容、质量以及速度都提出了明确的要求,这对于提高学生的阅读能力,培养语文素养,陶冶情操,促进学生终身学习和终身可持续发展,对于提高广大人民的文学素养具有极大的意义。
  • 学生心理描写范文阅读与指导(下)

    学生心理描写范文阅读与指导(下)

    本套书从服务于学生作文的目的出发,提供了学生有效阅读的不同范文,主要包括肖像描写、语言描写、行动描写、心理描写、场面描写、景物描写、风俗描写、叙述方式、抒情方式、话题表达等类文章,同时还提供了相应的阅读与写作把握方法等,具有很强的系统性、实用性、实践性和指导性,能够全面提高广大学生的阅读和作文能力。
热门推荐
  • 少校夫人太呆萌

    少校夫人太呆萌

    宁宝贝在宁家老小重重爱的包围下,终于在二十四岁的时候春心萌动了,对象不是别人,正是大明星朝西。朝西的声音真好听,比她的名字还要好听。朝西的脸长得真好看,比她军营里的士兵还要好看。朝西的年纪生的真是巧,配她的二十四刚刚好。男大三,不抱金砖抱金山,她和他一定是命中注定的鸳鸯,迟早比翼双双飞。朝西十九岁出道,在娱乐圈混迹八年,一年比一年风生水起。他性格淡然,不爱争名夺利,不爱江山美人。可老天爷好像偏是要惩罚他的孤高清傲,送来了一个宁宝贝。长得像娃娃的宁宝贝,会用软软糯糯声音叫他名字的宁宝贝,万事呆萌的宁宝贝......直到他的全世界都变成了宁宝贝。小剧场:朝西从影视城出来的时候正好看见自家老婆高举着一个眼熟的小红本在看门大爷面前晃悠。“怎么了?”宁宝贝扑过去。原来这新来的大爷不让她进,她为了证明自己的身份专门拿来了结婚证。朝西淡定的看着她另一只手里的手机,终于开口:“你可以打电话让我接你。”宁宝贝一呆:“忘了......”朝西无奈,温柔的牵起她的手往回走,夕阳把他的影子拖的很长,神情更是柔和了不少:“下次要记得......”“找我。”
  • 木源星神

    木源星神

    时间的指针不会因为一个人而中断,命运的齿轮更不会因为一个人而停顿。常言道;‘努力可以改变命运’,那已流逝的时间呢?或许一切都很渺茫,但他仍然固执的在寻找命运的道路上,试图将记忆中的指针拨会回过去。......超人化、无敌流、剧情分体、主角不像主角系列。
  • 第一重天

    第一重天

    剑气!魔法!手机!三十三重天,无尽仙域,一人独尊!
  • 亡清

    亡清

    这是一个沉闷的时代,这是华夏最黑暗时代的开端。他原以为自己不过是个看客,他只想悠闲的活着,享受自己重生的日子。可是命运有时候确十分的残酷。我们在整个华夏即将沦陷的时候,是默默看着它走向黑暗,还是发出一声呐喊。用我们的热血去挽救那早已转动了的命运轮盘。
  • 恋校草是女生

    恋校草是女生

    “嘿,我好像喜欢上你了……”“秦墨,我可是男孩子啊!”“为了你我愿意掰弯自己”…………“臭小子,不是说自己是男孩子吗?”“我……”
  • 史上极品宗门

    史上极品宗门

    李道飞:“咦,我不是在家洗澡吗?这是哪?”.....,穿越了,获得了系统,但也压力山大.....,这是一个人建造史上第一大宗的故事。“咦,这不是海神宗杨宗主吗,远道而来,岂能不小饮一杯可乐?”。。。“宗主,天罡宗联合数宗在数千里外号称灭了我宗”。“哦?小意思,东方快递送他上西天。”
  • 樱花爱恋99步

    樱花爱恋99步

    云雪儿:“如果时光可以倒退,我依然不后悔在那天遇见你,并爱上你。”李浩楠:“爱上你,是我这辈子最大的幸福,我只想让你记住,不管发生什么事,只要你转身,我便在你身后。”然而如果只是如果,时间不可能倒退。人生的路,也不可能重新再走一遍!拜了,初恋。
  • 张扬都市

    张扬都市

    张扬为躲避家里安排的婚姻,来到陌生的城市。却因为自己的善良的性格卷入到一场阴谋当中......看他如何翻手云雨笑傲都市......
  • 天行

    天行

    号称“北辰骑神”的天才玩家以自创的“牧马冲锋流”战术击败了国服第一弓手北冥雪,被誉为天纵战榜第一骑士的他,却受到小人排挤,最终离开了效力已久的银狐俱乐部。是沉沦,还是再次崛起?恰逢其时,月恒集团第四款游戏“天行”正式上线,虚拟世界再起风云!
  • 那时的花开在末尾

    那时的花开在末尾

    因为一个人照亮了另一个人的青春,所以我们怀念,因为你是我的浮生年华,所以我珍惜,苏半雪和林亦寒,照亮了整个青春。