您在這裡

效度

20 一月, 2016 - 17:04

效度,常被称为构念效度,是指测量在多大程度上反映了想要研究的构念。举例来说,同情心的测量是否真的反映了同情心,而不是衡量另一个构念同理心。效度可以用理论或实证的方法来评估,并且最好结合二者来评估。理论评估主要关注于操作性的测量在多大程度上转化了或表示了理论构念。这种类型的效度称为转化效度(或表示效度),包括两大类:表面效度和内容效度。转化效度通常用专家组的判断以及称作Q-sort的定性技术来评估,专家组对每个测量项(指标)进行打分以评价其与构念的概念化定义的匹配程度。

效度的实证评估基于实际观察检验既定的测量与一个或多个外部标准相关的程度。这种类型效度被称为效标关联效度,包括四种类型:聚合效度、区效度分、同时效度以及预测效度。转化效度检验了测量是否是潜在构念的有效反映,效标关联效度则是根据构念的理论来检验给定的测量是否以应该的方式进行。这种评估是基于观测数据的定量分析,使用了诸如相关分析、因子分析等统计技术。图表 7.2表明了效度的理论与实证评估的区别。然而,为充分保证社会科学研究测量的效度,这两种方法都是必要的。

注意这里讨论的不同类型的效度是指测量过程中的效度,这不同于假设检验过程的效度,如内部效度(因果关系),外部效度(普遍性),或统计结论的效度。假设检验过程的效度将在后续章节中讨论。

表面效度。表面效度指一个指标是否在“表面上”对潜在构念的合理测量。例如,无需做过多解释就可以理解一个人参加宗教祈祷仪式的频率可以作为一个人虔诚的指标。因此这一指标具有表面效度。然而,如果我们想要把员工从单位图书馆借书量作为测量员工士气的指标,那么这种测量很可能缺乏表面效度,因为这讲不通。有趣的是,一些在组织研究中广泛应用的测量似乎也缺乏表面效度。例如,一个组织的吸收能力(为改进组织流程而能吸收的新知识的数量)经常用研发能力(即,研发费用除以总收入)来测量。如果研究包含非常抽象的构念或难以区分的构念(如同情心和同理心),则值得考虑邀请一组专家来评估构念测量的表面效度。

media/image21.png
图表 7.2 效度评估的两种方法 

内容效度。内容效度是对一系列测量项与构念欲测的内容范围的匹配程度的评价。例如,若要对“饭店服务满意度”进行测量,可将其饭店服务的内容范围限定为食物的质量、侍者的态度、以及饭店的整体环境(是否嘈杂、有烟味等);为了达到足够的内容效度,需要建立一系列的指标来衡量饭店内顾客对食物质量、侍者态度以及等待时间长短、饭店整体环境等的满意度。当然,这种方法需要对一个构念的内容范围进行描述,这对诸如自尊、智力等较复杂的构念而言是非常困难的,所以对内容效度不太可能进行充分的评价。像表面效度一样,可以请一组专家来对构念的内容效度进行评价。

聚合效度是指测量与其意图测量的构念之间的接近程度,区分效度是指测量与未意图测量的构念之间的分歧程度,通常,聚合效度与区分效度被运用于一组相联系的构念。例如,如果你期望组织知识与组织组织绩效是相关的,那么该如何确定对组织知识的测量确实测量了组织知识(聚合效度)而不是组织绩效(区分效度)呢?聚合效度可以通过比较同一构念的各不同指标观测值之间的相似度(或高相关性)来衡量。区分效度则可以通过比较不同构念的指标差异来衡量,即具有较低的相关性。在上例中,如果组织知识和组织绩效各有三个项目,根据样本数据,我们可以通过软件对组织知识和组织绩效的每对项目做二元相关分析,如果组内的相似度很高,而组间的相似度很低,那么我们就同时实现了聚合效度和区分效度(如图表 7.3所示)。

media/image22.png
图表 7.3 聚合效度与区分效度二元相关分析 

另一个替代的方法也是更普遍使用的方法,即采用探索性因子分析来评价聚合效度和区分效度。作为一种数据精简方法,该分析基于上文中所提到二元相关系数结构,并通过主成分分析方法将一组给定指标聚合成更少的因子集。这些因子应完美地对应于我们所试图测量的理论构念。因子提取的一般标准是每个被提取的因子其特征值应高于1。根据潜在构念是否相关,可以对被提取的因子进行斜交旋转或正交旋转,以获得可用于将各构念的指标聚合为复合测量的因子权重。

正如图表 7.4中旋转负荷矩阵的例子,为了达到足够高的聚合效度,同一构念的各指标应在单个因子上具有0.6或更高的因子负荷(也叫做同因子负荷)。而为了达到更高的区分效度,这些指标应在所有其他因子上具有0.3或更低的因子负荷(也叫做跨因子负荷)。

多质多法(MTMM)方法是评价聚合效度和区分效度的更为精细的方法,它要求对每个构念运用两种以上的方法(如调查、个体观察,或者对教师和父母两组不同的被试进行调查)。这是一种比较繁琐并且实际运用不多的方法,所以在这里不再赘述。

效标关联效度通过变量是否能很好与当下或将来的标准相关联来衡量,包括同时效度和预测效度。预测效度是指测量在多大程度上预测了理论的预期结果,例如:成绩(SAT成绩)是否能用来预测学生将来的学术成就(GPA)?衡量预测效度需要设计反映构念理论联系的关系网。同时效度衡量的是某个指标在多大程度上与同时发生的其他标准相关联,例如:学生的微积分成绩与线性代数成绩之间是否有关联,这两门课程都属于数学课程,因此其成绩应同时相关。与聚合效度和区分效度不同的是,同时效度与预测效度在实证研究中通常忽略不计。

media/image23.png
图表 7.4 聚合效度与区分效度的探索性因子分析