第2章 实验设计与准实验设计

2.1 复习笔记

一、实验设计

实验设计可以看做是安排实验各种条件的方法,实验设计的目的在于消除或减少误差以便达到实验的目的,即确定某些变量、找出事件的原因。

(一)实验设计类型

1.随机组设计

(1)随机组设计的程序

随机组设计(random groups design)属于组间设计,它把被试分为两组,随机组1和随机组2,其程序如表2-1所示:

表2-1随机组设计

(2)随机组设计的逻辑

没有施加处理的随机组2通常叫做控制组,它代表着一种参考水平来决定实验处理是否有效。

这种设计的前提是实验组与控制组在测验前各方面都一样,这样,如果两组在测验上有差别,逻辑上就可以归结为是实验处理造成的。

(3)扩展的随机组设计

在实践中要随机挑选两个等组并不容易,因此,在应用随机组设计时一方面要尽可能做到随机挑选被试,另一方面还可以应用如下扩展了的随机组设计:

随机组1:无处理→测验

随机组2:x数量的处理→测验

随机组3:2x数量的处理→测验

随机组4:3x数量的处理→测验

随机组5:4x数量的处理→测验

其中的x,2x,3x等代表自变量的不同水平,并不一定是整倍数的关系。

2.组内设计

(1)组内设计的程序

组内设计(within-groups design)又称重复测量设计,其基本思想是一个被试或一组被试按一种顺序完成各实验条件,而另一个被试或另一组被试在另一种顺序中进行实验,而且,被试必须随机地分配到不同的顺序上。

(2)组内设计的优缺点

优点

a.组内设计中每一被试都以自己为对照条件。

b.组内设计比随机组设计对统计检验更为敏感。由于同一被试在几种实验任务中,或在同种任务的重复测量中的结果倾向于高度相关,因此显著性检验的标准差值就减少了,从而易于检测出较小的效应。

c.组内设计不需要事先对被试进行测验以在某一特点上平衡被试。

缺点

一种实验条件下的操作将会影响另一种实验条件下的操作。因为组内设计的实验中每一被试轮流在各种实验条件下进行实验,因此会使自变量与“练习”或“疲劳”的因素混淆起来。

(3)消除缺点的方法

随机地排出各实验条件下的顺序;

采用抵消平衡的方法。抵消平衡被试接受实验条件(自变量)的顺序,使每种实验条件以各种顺序出现的机会相同,以达到平衡由重复测量所产生的无关变量对因变量的混淆作用。

(4)实验设计对因变量的影响

实验设计已成为影响因变量的自变量之一。例如,Challis和Brodbeck(1992)认为,实验设计是影响补笔测验中加工水平效应的一个重要因素,因而系统地进行了实验。结果表明,组内设计不存在加工水平效应,但随机组设计与组内设计存在加工水平效应。

3.随机区组设计

(1)随机区组设计的程序

随机区组设计(randomized-block design)要求首先对被试作测验,然后按成绩分组,再把实验条件随机分配给各组中的被试。

(2)随机区组设计的优缺点

优点

a.随机区组设计中的每个被试只在一种实验条件下进行实验,因而避免了不同实验条件顺序的影响,因此,它具有组间设计的优点。

b.随机区组设计要求在一个区组中的被试在某一特点上是类似的,这样,对各个实验条件来说,被试基本上是类似的,这一点类似于组内设计,因此它又具有组内设计的优点。

缺点

a.这种设计的价值依赖于实验前的预测验对正式实验的预测性,预测性愈高价值愈大。

b.这种设计的有效性还取决于实验条件的多少。3~4种实验条件采用随机区组设计比较恰当。

4.拉丁方设计

(1)拉丁方设计的程序

拉丁方设计(Latin Square design)的要求是,每种条件在横行的顺序中只出现一次,在纵列中也只出现一次。

(2)拉丁方设计的优点

使用了完善的抵消顺序效应的措施,因而同时能测量多种变量。

(3)安排拉丁方的方法

当n为偶数

a.假设自变量有n个水平,那么,实验的第一种顺序就是:

1,2,n,3,n-1,4,n-2,5,n-3…

在这里,l代表第一种水平,依此类推。第二种顺序是依次在第一种顺序上加l,第三种顺序是依次在第二种顺序上加1,等等。而且,各顺序中遇到n时,改为1。

b.当n=4时,拉丁方的安排如下:

当n为奇数

a.采用平衡方块设计(balanced square design),需要使用两个方阵,第二个方阵与第一个方阵正好相反。一般说来,第一个方阵是按偶数个变量水平时构建方阵的方法建起来的。

b.设A,B,C为三种实验条件,有关的平衡方块如下:

(二)交互作用:多于一个自变量的实验

1.多因素实验的优点

(1)做一项有三个自变量的实验比分别做三个实验的效率要高。

(2)做一项实验比分别做三项实验易于保持控制变量恒定。

(3)多因素实验能够得到交互作用,这样的的实验结果比从几个单独实验所概括的结果更有价值,更接近生活实际。

2.实验研究

(1)两因素实验

实验程序

在某大学校园的咖啡店里,主试看到小桌子或是大桌子旁边坐着一个学生时,请求坐下并点来一份午饭。不久,主试离开桌子去买杯饮料。这时,假招待员(实验助手)把午饭扫走。当主试回来时,试图向这个学生借钱再买一份午饭。有时候,午饭不是由假招待员扫走,而是主试假装不小心弄掉在地上,然后向学生借钱。

实验变量

a.自变量:桌子(大或小);处理午饭方式(扫走或掉地)。

b.因变量:被试愿意借多少钱给一位陌生人。

实验结果

坐在大桌子边上的学生对午饭被扫走或是掉地都只愿意借出少量的钱;坐在小桌子边上的学生愿意借出较多的钱来帮助午饭被扫走的人。这个结果表现出了交互作用。

交互作用(interaction)

一项实验中有两个或两个以上自变量,当一个自变量的效果在另外一个自变量的每一水平上不一样时,我们就说存在着交互作用。

(2)单因素实验

假设这项实验是两项单独的实验。

第一项实验中,只有桌子的大小是唯一的自变量,而午饭总是被扫走。那么实验结果将会表明,坐在小桌子边上的人会借出较多的钱。但是从这个实验结果,研究者不能发现,要是午饭掉地,桌子的大小就不起什么作用。

在第三项实验中,处理午饭的方法是自变量,桌子大小是控制变量。如果用大桌子做实验,不管午饭的“遭遇”怎样,人们只愿意借出大致相同数目的钱。从这个结果,研究者不能发现,如果用小桌子做实验,借钱数量是有差别的。

由此可见,分别做两个实验会丧失许多信息,而在一项实验中包括两个或多个自变量,会获得较多的信息。

(3)从这个社会心理学实验中补充三点:

自变量至少是以两种水平存在的。

当把实验结果作图表示时,只有一个自变量的实验,自变量用横坐标表示,因变量用纵坐标表示。如果实验包括两个以上的自变量,那么一个自变量用横坐标表示,其余自变量画在图上,因变量用纵坐标表示。

交互作用反映在图中,表现为图中的线是交叉的。如果图中的线是平行的,就说明该实验不存在交互作用。

(三)因素设计及其数据处理

1.因素设计

(1)因素设计的定义

因素设计(factorial design)是关于两个或多个变量(因素)的一种实验设计,它的特点是将实验中每一变量的各个水平都结合起来进行实验。

因素设计的最简单形式就是实验中有两个自变量(因素),每个自变量各有两种水平,这就是2×2因素设计。

不同因素按水平形成的各种组合叫做处理。各种处理的总数是各因素所包括的水平数的乘积。

(2)因素设计的因素数量

因素设计一般使用两个或三个因素,每个因素有2~6种水平,因素过多或水平过多都将使实验变得十分复杂而难以进行,并且即使进行实验,其结果也很难解释。

(3)因素设计的方式

组间设计

对于2×2因素设计,有4种处理,如果每种处理使用8名被试,则可以采用像表2-2这样的分配方式。

表2-2  2×2因素设计(组间设计)

组内设计

对于2×2因素设计,每个被试都需要进行四次实验。设J代表的实验条件,K代表,L代表,M代表,那么,可用拉丁方的方法排列实验顺序如下:

表2-3  2×2因素设计(组内设计)

可以看到,组内设计大大节省了被试数量。

混合设计

对于2×2因素设计,设变量A用组内设计安排,变量B用组间设计安排,则可以采取表2-4这样的分配方式。

表2-4  2×2因素设计(混合设计)

2.因素设计的数据处理

(1)2×2因素设计(组间设计)的方差分析

互助行为实验

a.自变量:需要借笔记的原因(缺乏记笔记的能力,没有用心听讲);需要借笔记的频率(经常需要借,偶尔需要借)。

b.因变量:助人行为频率。

c.实验按2×2因素设计(组间设计)进行,假设获得的数据经整理后如表2-5所示:

表2-5  数据的重组

方差分析的公式

表2-6是进行方差分析计算的有关项目与公式,假设各小组的方差没有显著性差异。

表2-6  方差分析的项目与公式(组间设计)

=76+62=138

==9620

=42+35+34+27=138

I=2,J=2,K=10(表2.5中,每单元10个数据)

N=40(总共40个数据),

方差分析的结果

把表2-5中的数据分别代人表2-6中各项目的公式,计算结果如表2-7。

F值的显著性水平表明:I间差别即频率的两种水平对互助行为的影响是有显著差异的;J间差别即原因的两种水平对互助行为的影响也是有显著差异的。在频率与原因之间不存在交互作用。

表2-7  方差分析组间设计的2×2的因素设计

(2)2×2因素设计(混合设计)的方差分析

心境对学习影响的实验

a.自变量:心境(高兴,不快);故事情节(高兴,不快)。

b.自变量:对故事情节的回忆效果。

c.实验按2×2因素设计(混合设计)进行,心境是组间因素,故事情节是组内因素。假设获得的数据经整理后如表2-8所示:

表2-8  数据的重组

注:I=2,J=2,K=5,N=20(总共20个数据)。

方差分析的公式

表2-9  方差分析的项目与公式(混合设计)

方差分析的结果

把表2-8中的数据分别代入表2-9中各项目的公式,将计算结果列表如下:

表2-10  方差分析(混合设计的2×2因素设计)

F值的显著性水平表明:

a.不同心境之间(对高兴情节)的回忆差异显著,说明被试高兴时对高兴情节的记忆远远超过被试不快时对高兴情节的回忆。

b.不同心境间(对不快情节)的回忆差异显著,说明被试不快时对不快情节的记忆远远超过被试高兴时对不快情节的记忆。

c.不同情节之间(对高兴心境):被试高兴时对高兴情节的记忆显著好于对不快情节的记忆。

d.不同事件之间(对不快心境):被试不快时对不快情节的记忆显著好于对高兴情节的记忆。

e.情节和心境存在交互作用,被试的心境对记忆的影响依赖于要回忆的情节的性质。

(四)被试样本的大小

在单个实验中选用的被试样本大小可参考以下几种因素作决定。

1.某研究领域传统上使用多少被试。

2.计划使用什么样的统计分析。

3.如果预期在实验中变异会较大,或者认为将要发现的差别有特别重要的意义,就需要多一些被试。

4.在脑成像(fMRI)研究中,Firstone(1999)认为,7~12个被试的结果,宜用Conjunction analyses方法处理,而12~30个左右被试的结果,宜用Random-effect analyses方法处理。

(五)使用一个被试的实验

1.只使用一个被试的实验也是有意义的。有时候罕见的现象出现在一个人身上,对这些个案的详尽研究会给基本心理过程提供扎实可靠的资料。

2.1996年Klein通过对一名女大学生W.J.的个案研究得出结论:一个人的情景记忆与一个自我的人格表征是分离的。这样,单个被试的实验研究得出了关于人类的普遍的结论。

二、准实验设计和效度

(一)准实验设计

1.准实验设计的定义

在现场进行的实验研究中,被试不可能随机地分配到实验条件中,被试以非随机方式分配到实验处理上的设计,称为准实验设计(quasi-experimental design)。

2.准实验设计的分类

(1)不等组比较设计

不等组比较设计(nonequivalent comparison—group design或selection cohort design)对两个或更多自然形成的被试组进行研究。

这种设计最简单的例子是,对一个组经过实验处理以后测量它的因变量,然后与一个对照组的因变量相比较(黄一宁,1998;董奇,2004)。

(2)间歇时间序列设计

间歇时间序列设计(interrupted time-eries design)是在实施实验处理前后的一段时间里对某种效应进行多次重复测验。

由于这种设计缺乏控制组,所以无法剔除无关因素的干扰作用。为了克服这一弱点,可采用复合间歇时间系列设计,即在研究设计中增加一个没有接受实验处理的比较组,来替代控制组的部分功能(黄一宁,1998)。

这种设计的模式如下:

(3)交叉滞后组相关设计

交叉滞后组相关设计(cross-lagged panel corelational design)要求在时间1对两个变量的关系作出测定和相关分析,再在时间2作相似测定和分析,求得同步相关(见图2—10),为稳定性相关,它们实际上是重测信度。

在同步相关稳定的情况下,如果>,可以认为,与B引起A相比较A是B的更强的原因;反之,B是A的更强的原因(王重呜,l990)。

Eron等人应用交叉滞后组相关设计开展观看暴力电视节目是否导致犯罪行为的追踪研究(Eron,et al.,l972)。一个典型结果如图2-11所示。

结果表明:喜欢看电视暴力的9岁男孩与其l9岁时的攻击行为密切相关。

(二)效度问题

1.效度概述

(1)内部效度

在自变量与因变量之间证明有因果关系的联系,而且对实验结果的其它可能的解释均可排除,在这样的情况下这个实验被称为具有内部效度。

(2)外部效度

如果一个实验的结果可以推广、概括到其他的被试和其它的场合,那么,我们说它具有外部效度。

2.Anderson对效度的分类

Anderson(2001)认为效度包括过程效度(process validity)与结果效度(outcome validity)的区分,以及这两种效度的内部水平(internal level)和外部水平(external evel)的相互关系。

(1)过程效度与结果效度

结果效度是应用研究的目标,关注的是行为变化本身。应用领域的研究者想要把在某一特定情景下获得的结果推广到更一般的场合。

过程效度是基础研究的目标,关注的是表面结果背后的基本心理过程,通常是研究极为基本的心理过程以便概括为普遍规律。

结果效度与过程效度各有两个水平:内部水平与外部水平。内部水平指研究在某具体情景设置下的有效性,外部水平指超出该具体设置的概括化。内部效度是外部效度的必要条件。

内部结果效度(internal outcome validity)的评估始于统计显著性检验,达到统计显著性水平意味着特定设置下的研究结果是有效的;但外部结果效度(external outcome validity)的评估要求超越统计的推论。

内部过程效度(internal process validity)与外部过程效度(external process validity)的评估都依赖超越统计的推论,这是因为过程效度本质上不是数据、事实本身,而在概念。

(2)过程效度与结果效度的不一致

过程效度与结果效度这两个目标是不一致的,不可能两者兼得。

为了追求结果效度,特定的情景设置需要接近真实生活,这样,得到研究结果才容易推广,外部结果效度才会好。

追求过程效度要求使研究情景尽量简化、明确,以便排除其它心理过程造成的混淆。