在数据调查过程中,工作人员常常会遇到数据缺失现象。数据缺失分为三类,随机缺失,完全随机缺失,非随机缺失。无论哪种缺失,都可能导致严重的问题,或者大大降低统计的精度。利用IBM SPSS Statistics可以对数据缺失值进行分析,关于SPSS缺失值分析步骤是怎样的,SPSS缺失值分析结果怎么看的问题?本文结合实例,为大家做简单介绍。
一、SPSS缺失值分析步骤
由于非随机缺失值所在变量与自身取值有关(例如,高收入群体往往不愿意透露收入水平),或者与其他变量有关(例如,年龄项目缺失值可能与性别有关,因为很多女性不愿透露年龄),所以非随机缺失值难以进行估计分析。因此缺失值分析一般针对随机缺失和完全随机缺失类型。
图1是某个群体男性身高体重统计表,我们以此为例,使用SPSS进行缺失值分析。
点击【分析】,【缺失值分析】,弹出图2所示的对话框,将“身高”和“体重”指定为“定量变量”,勾选“EM”。
点击【模式】,勾选“个案表(按缺失值模式分组)”,将“变量-以下对象的缺失模式”指定为“以下对象的附加信息”,如图3所示,点击继续。
点击【描述】,勾选“单变量统计”,“使用由指示符变量构成的组执行t检验”,“生成分类变量和指示符变量的交叉表”,点击继续。点击确定即可。
以上就是SPSS缺失值分析的基本步骤,EM方法分析结果是怎样的?如何进行解读?我们在第二小节中向大家介绍。
二、SPSS缺失值分析结果怎么看
首先查看独立方差t检验,身高存在时,体重均值为67.588,身高缺失时,体重均值为62.000,体重存在时,身高均值为170.627,体重缺失时,体重均值为168.067,粗略来看,身高和体重未相互影响,提示两者为完全独立变量,但此时不能完全确定,还要结合EM相关性检验结果。
继续查看EM相关性表格,利特尔MCAR检验,其卡方值为4.332,显著性为0.115,大于0.05,此时认为缺失值为完全随机缺失类型,如果小于0.05,提示数据缺失为随机缺失类型。
SPSS缺失值分析步骤是怎样的,需要用户在分析功能中找到缺失值分析功能,按第一小节步骤操作即可。SPSS缺失值分析结果怎么看,我们需要关注EM相关性结果,利特尔MCAR检验结果显著性大于0.05,提示缺失变量为完全随机缺失类型,小于0.05,提示变量为随机缺失类型。