沿用上面的例子,我们假设特别课程(实验)相对于传统课程(对照)的效应依赖于教学时间(每周3小时或者6小时)。现在,我们有了一个2x2的因子设计,其中两个因子分别是课程类型(特别还是传统)和教学时间(每周3小时还是6小时)。这样一个设计不仅仅帮助我们估计每一个因子的独立效应,称为主效应,也估计出两个因子的联合效应,称为交互效应。为这种双因素因子设计而设计的一般线性模型如下:
y=β0+β1x1+β2x2+β3x1x2+ε
其中y代表学生实验之后的表现分数,x1是课程类型(特别还是传统课程),x2是教学时间(每周3小时还是6小时)。注意x1和x2都是虚拟变量,虽然x2看起来像是等比变量(3或6),它实际上代表了在因子设计中的两个不同的组。回归系数β1和β2提供了主效应的效应规模估计值,β3则提供了交互效应的效应规模估计值。此外,也可以使用一个双因素方差分析来进行同样的因子模型分析。有多个预测变量的回归分析有时候被称为多元回归,这与有多个结果变量的多变量回归是不同的。
以下是关于解读交互效应的注意事项。如果β3是显著的,那么意味着课程类型对学生表现的影响有赖于教学时间。在这个例子中,我们就不能显著地解读出课程类型(β1)或者教学时间(β2)的独立效应,因为这两个效应不能被区分开来。只有当交互效应不显著的时候,主效应才能被解读出来。
协变量也可以连同新的回归系数(比如,β4)一起被当作新的变量加入到因子设计中。协变量可以是定距或定性变量,即使我们关心的预测变量都是虚拟变量。协变量的解读与其他的预测变量的解读遵循同样的准则。
- 3513 reads