面对庞大的数据库,如何才能进行更加精准的分析?除了对整体数据进行分析外,我们还可以使用IBM SPSS Statistics的选择个案分析方法,指定数据的分析范围,比如以条件筛选的方式选择个案,以获得更精准的数据分析结果。
接下来,本文将分为两节,详细介绍IBM SPSS Statistics的选择个案分析方法。事不宜迟,一起来学习下吧。
一、打开数据文件
首先,打开一组包含定性与定量变量的数据,其中包含了账号、性别、地区三个定性变量,以及客单价、点击页面数两个定量变量,因后续需演示个案的条件筛选功能。
二、使用选择个案功能
接着,在IBM SPSS Statistics的数据菜单中,选择“选择个案”选项。
在打开的“选择个案”功能面板中,可使用选择所有个案、条件满足个案、随机个案等选项。其中所有个案,即不作任何筛选的选项,后续使用过滤输出时,可通过“所有个案”选项恢复已过滤的数据。
在输出方式的设置上,如果后续数据集还需要进行其他的分析操作,建议选择“将选定个案复制到新数据集”的方式。
过滤选项是将被筛选掉的个案暂时锁定,可在输出数据集中看到这些个案被划一斜线,而且数据集的末端会生成一个新的过滤变量(filter_$),保留的个案标记为1,锁定的个案标记为0。
由于个案只是暂时锁定的状态,如需恢复数据,只需选择“所有个案”,即可恢复。
接下来,我们使用实例逐一讲解不同的个案选项。
三、实例演示条件筛选
条件筛选选项,即通过函数、复杂方程式等设置条件,筛选个案范围的选项。如图5所示,单击“如果”按钮。
接着,在弹出的“if”函数面板中设置筛选条件。如图6所示,以筛选“点击页面数为1”的个案为例,需先将“点击页面数”添加到编辑框中,然后再分别单击“=”、“1”,完成“点击页面数=1”函数的编辑。
接着,在输出的数据集中,就可以获得仅包含“点击页面数为1”的个案。
四、实例演示随机个案样本
在进行数据研究时,经常需要获取数据的自然分布规律,比如地区的年龄分布、性别分布等。在分析自然分布规律时,需剔除各种人为因素,尽可能地做到随机性。
如需获取变量值的随机分布数据的话,随机个案样本就能很好地确保随机性。如图8所示,单击“样本”开启设置面板。
如图9所示,随机个案样本的百分比选项的随机性会更好,但如果是要获取早期录入数据的随机样本,可以选取第二种随机方式,即抽取N个个案,来自前N1个个案。
我们以抽取10%的所有个案为例,随机抽取个案。
如图10所示,可以看到,输出的数据集中仅包含了12个个案,且个案的序号都是随机的。
本节中,我们主要学习了选择个案中的条件筛选与随机选取个案的功能,下一节,将会继续讲解基于时间或个案范围、使用过滤变量两种选择个案的功能。如需获取下一节内容,欢迎访问城东书院网站。