6.1 卡方检验

卡方检验的目的就是通过样本数据的分布来检验总体分布与期望分布或某一理论分布是否一致,零假设是样本的总体分布与期望分布或某一理论分布无显著差异。

卡方检验基本思想是,如果从一个随机变量X中随机抽取若干个观察样本,这些样本落在Xk个互不相关的子集中的观察频数服从一个多项分布,当k趋于无穷时,这个多项分布服从卡方分布,根据这个思想,对变量X总体分布的检验可从各个观察频数的分析入手。

在零假设成立的前提下,如果变量值落在第i个子集中的概率为pi,相对应的期望频数为npi,期望频数的分布代表了零假设成立时的理论分布,可以采用卡方统计量来检验实际分布与期望的分布之间是否存在显著差异。典型的卡方统计量是Pearson统计量,定义为:

服从k-1个自由度的卡方分布。值越大,说明观测频数分布与期望分布差距越大。SPSS会自动计算值,并依据卡方分布表计算对应的概率p值。

如果p值小于显著性水平,拒绝零假设,认为总体分布与期望分布或某一理论分布有显著差异;反之,如果p值大于显著性水平,接受零假设,认为总体分布与期望分布或某一理论分布一致。