(2)复本信度。如果一套测量有两种以上的复本,则可交替使用,根据一个被测者接受两种复本测量的得分计算其相关系数,即可得复本信度。就是说,研究者设计两套测量工具以测定同一主题现象。例如,研究人员可设计两份问卷,每份使用不同的项目,但用来测量同一概念,两份都让同时在场的同一个或同一群被测者回答。以复本测量信度的方法可避免再测法的缺点,但所使用的必须是真正的复本,在题数、形式、内容及难度等方面都要一致。
(3)折半信度。在一种测量没有复本且只能实施一次的情况下,通常采用折半法来估计测量的信度。通用的折半法是将被测者的测量结果,按题目的单双数分成两半计分,再根据各人在这两半测量上的分数,计算其相关系数,即得折半信度。
例如,一个态度测量包括30个项目,若采用折半法技术来了解其内容一致性,则可将这30个项目分成相等的两部分,再求其相关。
二、社会测量的效度
1效度的意义
什么是效度?效度是指用测量工具测出变量的准确程度,即准确性。
例如,1米长的布一定是1米长,绝不会测得1.2米或0.8米,否则这把尺便缺乏准确性或者说缺乏效度。在这个例子中,尺是测量尺度,布是测量对象,布的“长度”是测量的主题。在研究测量上,如果某一测量方法能测出研究者所要测量的变量,则这种测量方法就可说具有有效性;如果我们想测量某一特征X,测量结果确实测出了物质X,那么我们所用的测量工具的效果是高的,亦即此项测验是有效的。又如,测验学生某科学习成绩,如果一张考试卷上仅出一些无关紧要的名词解释,不能反映学生整个学习情况,或者测验远远低于或高于学生现实水平,那么,这种测验就是无效的,是不能准确地反映学生情况的。
2效度的类型
效度主要是看其准确性。它是个多层面的概念,可以从三个角度去看,因此也可分为三种效度。
(1)内容效度。内容效度是测量内容的适合性和相符性。如图42所示:
要看X中得到的东西是否能代表X中的东西。也就是说,实际测量工具X是否抓住或体现了X这个概念的所有或主要特征。如果是的话,这样的测量效度就是高的。
一般人常把表面效度与内容相混淆,事实上两者意义不同。表面效度仅指测量在采用上或被测者主观上觉得有效的程度,不能替代客观决定的真正效度。
当然,在研究上为了取得被测者的信任与合作,表面效度也不容忽视,因而在测量的取材方面,必须顾及被测者的经验背景,选用合适的试题内容和用语,使测量兼具内容效度和表面效度。
(2)准则效度。准则效度或称之为实证效度、统计效度。这指的是用几种不同的测量方式或不同指标对同一变量进行测量时,将其中的一种方式或指标作为准则,其他的方式或指标与这个准则作比较。如果感到其他的方式及指标也有效,则具有准则效度。
准则效度可如图43所示:
X是一个变量,用X1、X2两种工具测量。用X1作为准则,X1与X2有关系,有同等的效果,我们讲,X2也是具有同等的效度。
例如,测量性别这一变量有几种测量方式:
性别={看,检查证件……}
在这几个方式中:将其中一种作为准则,如检查证件(即认为检查证件是最有效度的),在61个学生中,检查下来18个是女的,43个是男的。然后,我们用另一种方式“看”结果也是18个女,43个男,结果相同。这样,“看”这种测量方式也有效,也具有准则效度。
日常生活中也是如此。如我们认为某个人成绩好,我们的考试成绩与某人一样,则我们的成绩也好,在社会中这种情况可以“参照群体”来描述。当然,关键在于作为准则的测量方式,其指标一定要是有效的,否则越比越差。
(3)构念效度。“构念”本意是指心理学理论所涉及的抽象而属假设性的概念或变量,如智力、焦虑、机械性、成就动机等。现在泛指研究者根据研究需要而建构的一种概念,是一类特殊的概念。
构念效度则是指下述这种情况:变量X、Y在理论上有关系,如果测量X的指标X1与测量Y的指标Y1也有关系,并且我们以X2取代X1并复测整个理论时得出了使用X1时同样的结果,则我们称新的测量(X2)具有构念效度;反之,则没有构念效度。如图44所示:
例如,设想我们设立社会经济地位的两个标准,分别为X1和X2。假定我们有一个包括社会经济地位与生产率之间的负相关命题——社会经济地位越高,生育子女数越少。进而假定这个命题已通过X1这个指标对社会经济地位的测定而受到检验并已经得到证实。那么,构念效度就包括在理论上以指标X2取代X1和复测整个理论,如果我们整个理论(特别是含有指标X2的命题)得到了我们使用指标X1来测量社会经济地位时同样的结果,则我们说这个新的测量(指标X2)具有构念效度。
效度测定的这三种类型,从内容效度到准则效度,再到构念效度,可视为一个累进或积累的过程,效度测定后面的每一类型包括前面所有类型的成分,并具有某些新的特征。正如定距测量需要比定序测量多的变量信息,而定序测量需要比定类测量多的信息一样,构念效度需要比准则效度多的信息,而准则效度又需要比内容效度多的信息。由于这一原因,构念效度常被认为是最强有力的效度测量程序。因此,内容效度(含表面效度)只需要一个单一的概念和对它的一个单一的测量法,准则效度仅需要一个概念,但需要对该概念的两个以上的测量法;而构念效度不仅需要对一个概念的两个以上的测量法,而且还需要其他概念和可以通过命题与所研究的概念相关的测量法。
三、信度与效度的统一
效度与信度是优良测量工具所必备的两项主要条件。效度与信度之间存在的关系,可以用一句话来概括:信度是效度的必要条件而非充分条件。
信度是效度的必要条件,就是说,一个指标要有效度就必须有信度,不可信就不可能正确。但是,信度不是效度的充分条件,即是说,有了信度,不一定有效度。
两者的关系可如图45所示:
1可信且有效
这样的测量工具是优良的测量工具。在这种情况下,可测出真正要测的事物或现象,因为它既是可信的又是有效的(如下图所示)。
2可信但无效
这种类型的测量工具是可靠的,但不一定在特定的目标上有效,它可能在其他目标上有效,当然,这种无效的测量,可能是可信的,也可能是不可信的。假设我们拟测量变量X,结果却测量出变量;这样,虽然对变量X是无效的,但对于变量却是有效的测量。对于变量是有效的,自然它是可信的(如右图所示)。
3不可信但有效
这种情况在理论上应该是不存在的。因为效度的必要条件是信度,因此,一个不可信的测量工具对任何测量主题都是无效的。在效度和信度这两者之间,信度似乎更为重要,因为信度是效度的必要先决条件。
4不可信亦无效
这是测量中应避免的类型。在这种测量类型中,被测特征都散落在圆圈的周围或外面(如左图所示)。
总的来说,在设计测量工具(如问卷)中,要力图做到可信且有效,即达到信度与效度的统一。
为达到信度和效度的统一,我们要研究和分析影响资料信度和效度的原因,以对症下药,努力提高社会研究的信度和效度。
一般来说,影响资料信度和效度的因素有以下四个方面。
(1)调查者
调查者没有严谨的工作作风和实事求是的科学态度则会影响调查资料的信度和效度。例如,在抽样时不是按照科学的抽样方法抽取调查对象;或者在实地调查时,当所选的调查对象不在场而随便让人代替。如果这方面的问题较大,整个调查就可能没多大价值,因为它不能代表总体的真实情况。另外,调查者在实地调查时没有使调查对象明了调查目的和内容,或者对调查对象给予了一定的“启发”或暗示,从而影响资料的信度、效度。当然,调查者仅有提高资料信度和效度的主观愿望还不够,还必须深入了解调查研究的具体方法和技术。
(2)测量工具
如所设计的问卷中表述问题的语言不通俗、不清晰,使调查对象感到模棱两可;或者问题的答案并不是互相排斥,而是有交叉重合的现象,这样,回答者就较有可能作出前后不一致的回答;或者问题的答案数目过少,不能清楚地区分各调查对象意见之间的差异;或者问卷的容量太大,所用时间太长,造成了调查对象的疲劳或厌倦的感觉等。这些都会影响调查资料的信度和效度。
(3)调查对象
调查对象可能由于某种顾虑而抱着敷衍了事的态度,或者将某些情况轻描淡写,或者作不实的回答。如对涉及个人的思想观念、态度、意见之类的问题不作回答或按社会舆论的要求去编造答案等。
(4)环境因素及其他偶然因素
调查时的环境,外界因素的干扰,在资料的编码、登陆、录入计算机的过程中,每一步骤都可能出现疏忽或差错,都会降低调查资料的信度和效度。