IBM SPSS Statistics的二项分布检验,属于非参数检验中的一种分析方法,与参数检验不同,非参数检验是在总体方差未知的情况下,利用样本数据对总体分布等进行推断分析的方法。
而二项分布检验是用于二值取值样本数据的检验方法,通过验证样本数据是否服从概率为P的二项分布来推断样本所属总体是否符合概率为P的二项分布。接下来,我们会以一个检验产品合格率是否符合指定合格率的事例作为例子。
一、使用的数据类型
由于二项分布检验是用于二值取值的检验方法,在分析数据时,如图1所示,需使用数值型的数据。
为了更好地识别变量中数值的含义,如图2所示,可以在变量的值标签中,标注数值的值标签。在本例中,分别使用1、0代表合格、不合格。
二、应用二项分布检验
了解了二项分布使用的数据类型后,就可以打开IBM SPSS Statistics的二项分布检验功能,进一步了解其使用的方法。
如图3所示,依次单击分析-非参数检验-旧对话框-二项检验,打开二项检验的设置面板。
先简单了解一下二项检验中的选项含义:
1. 检验变量列表,即用于二项检验的变量
2. 定义二分法,用于定义二值的取值。如数据仅包含二值,可选择“从数据中获取”;如数据包含多个值,就需要设置“分割点”,将数据分为两组取值
3. 检验比例,即用于验证数据是否服从的概率P
接下来,我们使用示例数据实际操作一下。
1.选择变量
本例中检验的是抽样产品的合格率是否符合98%的标准,按照该检验目的,如图5所示,需将“是否合格”变量添加为检验变量列表,设置“从数据中获取”的方法,并将检验比例设置为“0.98”。
2.精确检验
由于二项分布属于非参数检验,需要进行精确检验的设置。一般情况下,保持默认的“仅渐进法”选项。蒙特卡洛法、精确法用于总体非渐进分布的情况。
3.选项设置
接着,设置统计数值以及缺失值的处理方法。为了更全面地分析数据,可同时勾选“描述”与“四分位数”。
4.结果解读
完成以上设置后,运行检验。
如图8所示,可以看到,样本的合格率为95%,与检验比例98%相比较,其显著性为0.02<0.05,表明当前样本的合格率与检验比例有显著差异,也就是说,当前样本的合格率不符合标准。
三、小结
综上所述,IBM SPSS Statistics的二项分布检验,是一种非参数的检验方法,用于推断样本所属总体是否符合概率为P的分布,适用于分析二值取值变量数据是否符合标准概率的情况。